新聞 5 / 12

研究突破

幻覺是承諾失敗:更大的 LLM 儘管知道答案仍出錯

Hallucination as Commitment Failure: Larger LLMs Misfire Despite Knowing the Answer

幻覺是承諾失敗:更大的 LLM 儘管知道答案仍出錯

arXiv cs.CL · 2026-05-22

摘要

研究發現 LLM 的幻覺並非源於知識缺失,而是一種「承諾失敗」。在 Qwen 和 Llama 模型中,16-47% 的幻覺發生時,正確答案概念已在生成分佈中具有相當的概率質量,且這個比例隨模型規模單調遞增。問題的根源在於概率分佈方式,而非答案是否存在——大模型在有多個答案概念競爭時,常誤將概率分散而非集中在正確答案上。

開發者:需要重新審視 LLM 幻覺的根本成因,改進採樣和解碼策略

投資人:此研究揭示大模型存在的根本限制可能無法單純通過增加參數解決

一般用戶:說明 AI 助手回答錯誤有時是邏輯分配問題,未來可能透過更好的推理機制改善

重要性評分

78/100

🟠 值得關注

大語言模型幻覺概率分佈模型規模
原文出處
上一則大幅裁員換 AI 的公司將輸給堅持招人的競爭者下一則AdventHealth 採用 OpenAI ChatGPT for Healthcare 推進全人照護

喜歡這篇?每天早晨還有更多。

訂閱 5min AI,讓 AI 替你追蹤整個 AI 世界。

相關指南

🤖 本文摘要由 AI 自動生成,內容源自原始報導。如有疑慮,請參閱關於我們

喜歡這篇?每天早晨還有更多。

訂閱 5min AI,讓 AI 替你追蹤整個 AI 世界。