幻覺是承諾失敗：更大的 LLM 儘管知道答案仍出錯

Hallucination as Commitment Failure: Larger LLMs Misfire Despite Knowing the Answer

arXiv cs.CL · 2026-05-22

摘要

研究發現 LLM 的幻覺並非源於知識缺失，而是一種「承諾失敗」。在 Qwen 和 Llama 模型中，16-47% 的幻覺發生時，正確答案概念已在生成分佈中具有相當的概率質量，且這個比例隨模型規模單調遞增。問題的根源在於概率分佈方式，而非答案是否存在——大模型在有多個答案概念競爭時，常誤將概率分散而非集中在正確答案上。

●開發者：需要重新審視 LLM 幻覺的根本成因，改進採樣和解碼策略

●投資人：此研究揭示大模型存在的根本限制可能無法單純通過增加參數解決

●一般用戶：說明 AI 助手回答錯誤有時是邏輯分配問題，未來可能透過更好的推理機制改善

重要性評分

78/100

🟠 值得關注

大語言模型幻覺概率分佈模型規模

原文出處

上一則← 大幅裁員換 AI 的公司將輸給堅持招人的競爭者下一則AdventHealth 採用 OpenAI ChatGPT for Healthcare 推進全人照護 →

喜歡這篇？每天早晨還有更多。

訂閱 5min AI，讓 AI 替你追蹤整個 AI 世界。