哈佛最新研究：用AI大型語(yǔ)言模型看病 80%的初步診斷都是錯(cuò)的

2026-04-15 19:02:13

每經(jīng)AI快訊，4月15日，美國(guó)哈佛醫(yī)學(xué)院的一個(gè)研究團(tuán)隊(duì)評(píng)估了20幾種最先進(jìn)的AI大型語(yǔ)言模型（LLM）的診斷能力，其中包括ChatGPT、DeepSeek、Gemini和Claude。結(jié)果顯示，基于患者的初步癥狀和體征進(jìn)行“鑒別診斷”（識(shí)別可能的疾?。┑腻e(cuò)誤率高達(dá)80%。這項(xiàng)研究進(jìn)一步顯示，在患者提供更多檢測(cè)結(jié)果后，大模型可以將“最終診斷”的失敗率降至40%左右。研究人員表示，這意味著AI聊天機(jī)器人需要通過(guò)充分的患者信息，才能對(duì)疾病作出更為精準(zhǔn)的診斷，患者無(wú)法提供完整的健康檢測(cè)信息時(shí)，AI提供的結(jié)果并不可靠。研究人員還強(qiáng)調(diào)：“人工智能尚未達(dá)到無(wú)需醫(yī)療專(zhuān)業(yè)人員干預(yù)即可為患者做出診斷決策的水平。” (第一財(cái)經(jīng))

責(zé)編陳鵬程

特別提醒：如果我們使用了您的圖片，請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

上一篇文章

中國(guó)巨石：一季度凈利潤(rùn)同比預(yù)增60%至80%

返回每經(jīng)網(wǎng)首頁(yè)

下一篇文章

匯源通信：持股5%以上股東泉州晟輝600.00萬(wàn)股被司法再凍結(jié)

相關(guān)文章