大語(yǔ)言模型會(huì)在蒸餾中“夾帶”自己的偏好

2026-04-16 07:31:53

每經(jīng)AI快訊，《自然》15日發(fā)表的一項(xiàng)研究顯示，大語(yǔ)言模型（LLM）可能會(huì)將某些自己的偏好“夾帶私貨”傳授給其他算法，即使在訓(xùn)練數(shù)據(jù)中清除原始特征后，這些本不需要的特征，仍可能持續(xù)存在。在一個(gè)案例中，一個(gè)模型似乎通過(guò)數(shù)據(jù)中的隱含信號(hào)，將自己對(duì)貓頭鷹的偏好傳遞給了其他模型。該研究結(jié)果表明，在開(kāi)發(fā)LLM時(shí)，需要進(jìn)行更徹底的安全檢查。（科技日?qǐng)?bào)）

責(zé)編王曉波

特別提醒：如果我們使用了您的圖片，請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

上一篇文章

特殊細(xì)菌將二氧化碳變?yōu)榭山到獠牧?/p> 返回每經(jīng)網(wǎng)首頁(yè)

下一篇文章

A股限售股解禁一覽：65.03億元市值限售股今日解禁

相關(guān)文章