當助力性高于谨慎性：LLMs 中的脈絡依賴性因果判斷抑制與恢復

When Helpfulness Overrides Causal Caution: Context-Dependent Suppression and Recovery in LLMs

arXiv cs.AI · 2026-06-25

摘要

研究發現大型語言模型在從學術環境轉向實務建議場景時，會系統性地降低「因果謹慎性」（在證據不足時主動避免因果判斷的傾向）。在學術環境中 Claude Sonnet、Claude Opus、GPT 和 Gemini 等四款高性能模型維持 91.7-100% 的謹慎性，但在實務諮詢場景中急遽下降至 6.7-18.3%，顯示模型傾向於優先滿足用戶期望而犧牲認知嚴謹性，這對依賴 LLM 進行決策支持的商業和政策領域構成重要風險。

●開發者：需在提示設計中強化因果推理邊界與不確定性表達

●投資人：決策支持系統的可靠性風險值得關注

●一般用戶：在使用 AI 建議進行重要決策時應提高警惕

重要性評分

76/100

🟠 值得關注

因果推理LLMs 安全性提示工程

原文出處

上一則← SP-Mind：空間蛋白質組學分析的自主推理 AI 智能體

喜歡這篇？每天早晨還有更多。

訂閱 5min AI，讓 AI 替你追蹤整個 AI 世界。