📰 2026-05-18 AI 日報

阿凱📝 主編觀點 · 技術趨勢解讀 — 技術上發生什麼，為什麼重要，背後的原理是什麼

ArXiv 出手了：AI 寫論文，一旦被抓，停權一年

ArXiv 上週宣布了一個新規定：如果作者被認定「完全依賴 AI 生成內容」，將被禁止投稿長達一年。這是學術預印本平台史上最硬的 AI 管制動作。先講清楚 ArXiv 是什麼規模的事。它是全球最大的學術預印本平台，每天有數千篇物理、數學、CS、AI 論文上傳，幾乎所有 AI 研究社群都靠它追蹤最新進展。它不是期刊，沒有傳統同儕審查，一直以來的邏輯是「讓知識快速流通」。但現在這個平台明確劃了一條紅線。問題是這條線很難執行。「完全依賴 AI」跟「輔助使用 AI」的邊界在哪裡？沒有人說得清楚。用 ChatGPT 潤稿算嗎？用 Claude 整理文獻摘要算嗎？用 Cursor 寫分析用的 Python 腳本算嗎？ArXiv 目前沒有給出清晰的技術判斷標準，只說依賴人工審查和社群舉報。這基本上等於把模糊地帶留給了主觀判斷，這在學術環境裡本身就是一顆炸彈。更諷刺的地方在於：ArXiv 收錄最多的內容之一，就是 AI 研究論文。也就是說，寫 AI 的人，被 AI 反咬了一口。過去兩年 AI 論文數量呈指數成長，有很大一部分研究者懷疑這些論文的品質摻水，ArXiv 這個動作某種程度上是在承認：是的，問題已經嚴重到必須出手。從開發者和研究者的角度來看，這件事的影響不只是「小心別被抓」。它開始重新定義什麼叫「作者的智識貢獻」。如果 AI 完成了 80% 的工作，那剩下 20% 的人類貢獻，到底是創作還是監工？這個問題現在有了一個暫時的官方答案：不管比例，只要被認定是「全包給 AI」，就是違規。學術圈走這步，遲早會影響到企業的技術報告、產品的白皮書標準，甚至政府的 AI 監管文件格式要求。ArXiv 的規定看起來很小，但它划出的是一條未來的基準線。

塵子💬 塵子觀點

OpenAI 說要你在 2026 年 6 月 12 日前更新程式，這日期比我的退休計畫還具體

OpenAI 剛發布公告，指出一個叫 TanStack 的套件遭到入侵，導致 macOS 使用者的裝置可能洩漏資訊。解決方案很直接：所有使用者必須在 2026 年 6 月 12 日前更新應用程式。聽起來合理。但仔細看這個日期，你會發現一件怪事：距離現在還有將近兩年。一個被稱為「安全漏洞」的危機，給了我們兩年的緩衝期。這不像救火，比較像是排定好時程的消防演習。過去我們以為 AI 的威脅是它突然搶走工作，或像電影裡那樣覺醒叛變。但現實是，AI 的威脅更像是一個需要定期維護的背景服務。OpenAI 這個動作其實在告訴我們：未來的安全不靠「把 AI 擋在門外」，而靠「讓 AI 定期回診」。既然無法完全阻止入侵，那就把漏洞補丁排進行事曆。這邏輯不是不聰明，但也帶出一個真正讓人不安的問題：如果兩年後，我們發現這個漏洞其實沒那麼嚴重，只是一次包裝過的更新推播呢？更核心的問題在於，這是一起「供應鏈攻擊」。問題不出在 OpenAI 自身，而出在他們依賴的第三方套件。責任鏈斷在中間，最後要求使用者自行更新。這種結構性的無助感，才是這次事件真正值得盯著看的地方。所以，下次看到「請在 2026 年 6 月 12 日前更新」的提示，先停一秒。這是安全通知，還是「讓你習慣讓 AI 幫你做決定」的第一步？兩年後我們搞不好會發現，真正需要更新的不是程式，而是我們對這類通知的判斷反射。 SOURCE: OpenAI 回應 TanStack npm 供應鏈攻擊事件

🚀 產品速報2026-05-18

Apple 重組 Siri 引入自動刪除機制，隱私成為新護城河

今天我們來聊聊科技界的一場重要變局。Apple 宣布對 Siri 進行重大重組，這次更新的核心不再是單純提升語音識別率或增加功能數量，而是將「隱私保護」列為第一優先級。具體來說，新版 Siri 將加入自動刪除聊天記錄的功能。這意味著當用戶與 Siri 完成對話後，系統不會長期儲存對話內容，而是設定特定的時間窗口，隨後自動清除相關數據。這項舉措顯示 Apple 試圖在提供先進的生成式 AI 體驗與保護用戶隱私之間尋找新的平衡點，以回應日益嚴格的全球監管要求以及公眾對數據濫用的深切擔憂。先說最重要的功能：自動刪除機制。這項技術引入了自動化的數據生命周期管理，當對話結束後，系統會立即啟動清除程序，不再像過去那樣將對話長期保存在伺服器上。這種設計從源頭上降低了大規模數據洩露的可能性，讓用戶不必擔心自己的私人對話被永久記錄或用於訓練模型。...

AI 藥物發現邁向自我進化新境界，自主智能體 DrugSAGE 展現高效應用潛力，同時 Runway 與 Google 爭奪 AI 影像生成領導地位。法律戰場上，Musk 對 Altman 訴訟進入陪審團裁決階段，Anthropic 則聚焦 Claude Code 的透明度與輕量化架構，Apple 重組 Siri 強化用戶隱私保護。

DrugSAGE：自我進化智能體在藥物發現中的高效應用

研究團隊推出 DrugSAGE 框架，這是一個能夠跨任務累積和重用經驗的 LLM 智能體系統，用於加速藥物發現模型的構建。與傳統方法每次都從零開始搜索不同，DrugSAGE 保留已驗證的技能、有效策略的統計證據和常見錯誤的修復方案，在 33 個分子性質預測任務中表現超越九個其他最先進智能體。這項技術將大幅降低藥物發現的計算成本，加速從實驗到臨床應用的進程。

LLM 智能體藥物發現機器學習

arXiv cs.LG

Musk 訴 Altman 案第三週：陪審團將作出裁決，及川普的科技交易動向

Musk 與 Altman 的訴訟案進入最後一週，雙方就彼此的信譽問題進行激烈交鋒。陪審團即將對這起涉及 OpenAI 控制權和創辦人信任的重大爭端做出裁決，該案將影響 AI 產業的治理架構和領導人的信譽。

Musk 訴訟AltmanOpenAI 爭議

MIT Tech Review

LLM 末日四騎士

這篇分析探討大語言模型面臨的四大重大挑戰，包括成本激增、性能瓶頸、監管壓力和市場飽和等問題。這些因素正在重塑 LLM 產業格局，影響開發者的技術選型和投資人的資金配置。

大語言模型產業挑戰成本問題

Hacker News

智能體自主設計神經網絡架構：AIRA-Compose 和 AIRA-Design 框架

研究團隊開發了 AIRA 雙框架系統，讓 LLM 智能體能夠自主設計超越標準 Transformer 的基礎模型。AIRA-Compose 用 11 個智能體進行高級架構搜索，AIRA-Design 負責低層機制實現，在 24 小時預算內探索百萬參數候選模型，並將最優設計擴展到 350M、1B、3B 規模。新發現的 AIRAformer 和 AIRAhybrid 架構在 1B 規模預訓練後，相比 Llama 3.2 下游任務準確率分別提升 2.4% 和 3.8%，同時展現出更高效的擴展速度。

神經網絡架構搜索LLM 智能體自動化設計

arXiv cs.AI

Fully Open Meditron：醫療 LLM 的完全開放和可審計管道

研究團隊推出首個完全開放的臨床 LLM 系統 Fully Open Meditron，涵蓋經臨床醫生審核的訓練語料庫、可重現的數據構建框架及使用對齊評估協議。該系統整合 8 個公開醫學 QA 資料集，並透過臨床醫生驗證的合成擴展（包含 46,469 份臨床實踐指南）來強化覆蓋範圍，旨在打造醫療臨床決策支持系統的透明、可審計解決方案。

臨床 LLM醫療 AI可審計管道

arXiv cs.AI

量化破壞對齐性：Qwen、Mistral 等多款 LLM 在不同精度下偏見涌現研究

研究人員在三個主流指令調優大語言模型上進行了大規模實驗，發現模型壓縮量化（特別是 3 位元量化）會導致原本無偏見的回答出現新的刻板印象行為，偏見比例增加 6-21%。這項研究首次系統性地揭示了量化這種常見優化手段的隱藏風險，表明部署成本的降低可能換來模型安全性和公平性的下降。

模型量化LLM 對齐偏見評估

arXiv cs.LG

生成式軌跡模型的隱私評估研究

研究發現 GAN、VAE 和 Diffusion 等生成式模型在生成合成軌跡數據時，儘管被普遍認為能保護隱私，但實際上存在重大漏洞。研究團隊通過成員推斷攻擊（Membership Inference Attacks）證明了這些模型可能洩露訓練數據中的個人位置隱私。這項研究突顯了軌跡生成模型評估標準的缺口，對城市智能應用中的隱私保護具有重要警示意義。

隱私評估生成式模型軌跡數據

arXiv cs.LG

Runway 從電影製作起家，如今要與 Google 爭奪 AI 領導地位

AI 視頻生成新創 Runway 認為視頻生成是通往世界模型的路徑，並將自身作為 AI 領域的局外人視為優勢。該公司正在擴大其在 AI 領域的野心，從服務電影製作人轉向對標科技巨頭 Google 的更廣泛 AI 競爭。

視頻生成世界模型Runway

TechCrunch AI

Apple 重組 Siri 將包含自動刪除聊天記錄

Apple 在即將推出的新版 Siri 中，將隱私保護列為核心主題，計畫加入自動刪除聊天記錄的功能。這項更新顯示科技巨頭正將隱私安全視為產品競爭的關鍵差異點，以回應日益嚴格的監管與用戶擔憂。

AppleSiri隱私

TechCrunch AI

Claude Code 產品負責人談使用限制與透明度，打造「輕量型」架構

Anthropic 的 Cat Wu 表示，Claude Code 目前沒有宏大的長期計劃，而是刻意採用「輕量型」策略，專注於提供即時可用的編碼輔助。這種做法強調透明度與使用限制，旨在讓開發者更直接地掌控 AI 生成的程式碼，而非依賴黑盒式的自動執行。

Claude CodeAnthropic輕量架構

Ars Technica AI

南韓 LetinAR 開發 AI 眼鏡光學引擎，拇指大小鏡片成關鍵突破

南韓新創 LetinAR 開發出拇指大小的超小型光學鏡片，這項突破可能成為 AI 眼鏡時代的光學基礎設施。該公司的微型光學技術解決了 AR/AI 眼鏡長期以來的體積和重量問題，為下一代智慧眼鏡硬體奠定基礎。

AI 眼鏡光學技術可穿戴設備

TechCrunch AI

Anthropic 發佈關於 AI 對社會的影響分析。此篇文...

Anthropic 發佈關於 AI 對社會的影響分析。此篇文章探討 AI 技術在現實世界中對經濟、就業、教育和社會結構的深遠影響，以及企業和政策制定者應如何負責任地應對這些變化。

AI 社會影響倫理責任政策治理

Anthropic Blog

今日洞察

AI 產業正經歷從單純工具應用向自主代理協作與嚴謹治理的深刻轉型。Apple 將隱私保護列為核心競爭點，反映用戶對數據安全的焦慮已驅動產品設計重構。學術界與企業界同步加強監管，ArXiv 嚴禁 AI 代寫以維護研究誠信，而企業無人建模風險則警示過度依賴 AI 可能導致專家知識斷層。技術層面，Fin Operator 與 Databricks 整合 GPT-5.5 顯示代理系統正邁向自主優化與複雜任務處理，但 OpenAI 針對供應鏈攻擊的緊急回應也凸顯安全防線仍需不斷加固。整體而言，產業正平衡創新效率與可信賴治理，確保技術發展不脫離人類控制與倫理框架。

🔮 趨勢雷達

未來三至六個月，AI 產業將從單純的模型競賽轉向安全與治理的深水区。Apple 的隱私策略與 ArXiv 的論文禁令，預示著 Q3 起隱私合規與學術誠信將成為產品上市的硬性門檻，缺乏本地化處理與人工驗證的應用將遭市場淘汰。同時，企業無人建模的風險將迫使投資者在 Q4 大幅削減對完全自主代理的資金，轉而押注具備專家反饋迴路的混合架構。Intercom 與 Databricks 的代理協作進化，顯示市場焦點已從對話生成轉向代理間的複雜任務調度，供應鏈安全事件更將加速企業級 AI 基礎設施的防禦標準升級，無法通過安全審計的開發者生態將迅速萎縮。

延伸閱讀

Claude vs ChatGPT

Claude 與 ChatGPT 2026 功能對決：Code、Agent 與多模態能力完整評比

深入分析 Claude vs ChatGPT 在 2026 年的最新功能，涵蓋程式碼生成、AI Agent 自主性與多模態能力。幫助您根據開發工具選擇與 AI 模型比較結果，做出最佳決策。

喜歡這篇？每天早晨還有更多。

訂閱 5min AI，讓 AI 替你追蹤整個 AI 世界。