2026-04-15 19:02:13
每經(jīng)AI快訊,4月15日,美國(guó)哈佛醫(yī)學(xué)院的一個(gè)研究團(tuán)隊(duì)評(píng)估了20幾種最先進(jìn)的AI大型語(yǔ)言模型(LLM)的診斷能力,其中包括ChatGPT、DeepSeek、Gemini和Claude。結(jié)果顯示,基于患者的初步癥狀和體征進(jìn)行“鑒別診斷”(識(shí)別可能的疾?。┑腻e(cuò)誤率高達(dá)80%。這項(xiàng)研究進(jìn)一步顯示,在患者提供更多檢測(cè)結(jié)果后,大模型可以將“最終診斷”的失敗率降至40%左右。研究人員表示,這意味著AI聊天機(jī)器人需要通過(guò)充分的患者信息,才能對(duì)疾病作出更為精準(zhǔn)的診斷,患者無(wú)法提供完整的健康檢測(cè)信息時(shí),AI提供的結(jié)果并不可靠。研究人員還強(qiáng)調(diào):“人工智能尚未達(dá)到無(wú)需醫(yī)療專(zhuān)業(yè)人員干預(yù)即可為患者做出診斷決策的水平。” (第一財(cái)經(jīng))
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP