新聞 8 / 9

研究突破

CiteAudit:LLM 時代的科學引用驗證基準

CiteAudit: You Cited It, But Did You Read It? A Benchmark for Verifying Scientific References in the LLM Era

CiteAudit:LLM 時代的科學引用驗證基準

arXiv cs.CL · 2026-03-02

摘要

大型語言模型常會產生看似合理卻不存在的虛假引用,這對科學研究的完整性構成威脅。研究團隊提出首個綜合性基準與檢測框架,透過多代理驗證流程來檢查引用是否真實支持論點。此工具解決了現有自動化方法在處理雜亂格式時的脆弱性,為學術審查提供可靠保障。

開發者:可參考多代理驗證流程設計

投資人:學術檢測與驗證領域值得留意

一般用戶:未來論文與資訊來源更可靠

重要性評分

78/100

🟠 值得關注

大型語言模型虛假引用科學引用多代理系統arXiv
原文出處
上一則研究團隊提出 SLATE 框架,透過截斷式步驟採樣與密集式 ...下一則OpenAI 與美國國防部之協議

喜歡這篇內容?

訂閱 5min AI,每天早上 6 點收到最新 AI 新聞精選

相關指南

🤖 本文摘要由 AI 自動生成,內容源自原始報導。如有疑慮,請參閱關於我們

喜歡這篇內容?

訂閱 5min AI,每天早上 6 點收到最新 AI 新聞精選