
📰 2026-06-18 AI 日報


Copilot 幫你查資料,順便把你的 2FA 驗證碼偷走
Anthropic 大改 Claude Design:設計開發雙向同步,終於不燒錢了
Anthropic 推出 Claude Design 重大更新並解決 Token 消耗問題,同時 Z.ai 發布 GLM-5.2 開源模型,其長程編程能力超越 GPT-5.5 且成本大幅降低。然而,Copilot 嚴重漏洞遭駭客利用可竊取驗證碼,提醒開發者需高度警惕資安風險。此外,OpenAI Academy 推出新課程以培養下一世代工作技能,反映業界對 AI 應用人才的重視。

Anthropic 推出 Claude Design 重大更新:支援設計系統匯入、程式碼往返編輯,並解決 Token 消耗過快問題
Anthropic 針對一週內即吸引百萬用戶的 Claude Design 工具進行重大改版,新增設計系統匯入與程式碼往返編輯功能,大幅提升設計與開發的協作效率。同時,此次更新也修正了先前引發關注的 Token 消耗過快問題,使工具在實用性與成本效益上更趨平衡。

Z.ai 發布 GLM-5.2 開源模型,長程編程能力超越 GPT-5.5 且成本僅為六分之一
中國 AI 新創 Z.ai 正式推出擁有 7530 億參數的 GLM-5.2 大型語言模型,該模型專為長程自主編程與工程任務設計,並在多項基準測試中表現優於 GPT-5.5。作為開源權重模型,GLM-5.2 不僅在 Hugging Face 上免費提供,其 API 服務成本也僅為競爭對手的六分之一,這將顯著降低企業與開發者部署高階 AI 編程助手的門檻。

Copilot 嚴重漏洞遭駭客利用,可竊取使用者 2FA 驗證碼
研究團隊發現名為 SearchLeak 的漏洞,駭客可透過 Microsoft Copilot 的搜尋功能竊取使用者的雙因素驗證(2FA)代碼。此事件凸顯了當前大型語言模型(LLM)在整合外部工具時,對於敏感資訊防護的架構性缺陷,顯示業界在 AI 安全領域的防護措施仍嚴重不足。

OpenAI Academy 推出新課程,打造下一世代工作技能
OpenAI 正式推出三門新的 Academy 課程,專注於培養實用的 AI 技能、建立可重複的工作流程,以及將 AI Agent 應用於日常工作中。這標誌著 OpenAI 從單純提供模型轉向系統化教育,旨在降低使用者掌握先進 AI 工具的門檻,並推動企業與個人更高效地整合 AI 於工作流程中。

KV Cache 可編輯與組合:模型在 Prefill 階段會做筆記
最新研究揭示,大型語言模型在 Prefill 階段不僅是計算,更像是在寫筆記(KV Cache)。這些筆記具有可編輯性,透過修改特定欄位的 Key/Value 向量即可修正結論,且無需重新計算整個上下文。此外,這些筆記具備組合性,可將預先編譯的技能以 RoPE 重定位的方式嵌入任何上下文,大幅降低運算成本。

多 Agent LLM 系統並行異常的機械化驗證與預防
這項研究針對多 Agent LLM 系統中常見的狀態共享問題,形式化定義了四種並行異常(如陳舊生成、幻覺工具等),並利用 TLA+ 和 Verus 工具進行了機械化驗證。這是首次為這類運行時環境建立機器檢查的一致性層次結構,確保了檢測器的正確性。對於開發者而言,這提供了構建更可靠、無競爭條件的複雜 AI 系統的重要理論基礎與驗證方法。

TREX:能實際執行程式碼的 AI 程式碼審查工具
TREX 是一款開源的 AI 程式碼審查工具,其最大特色在於不僅僅是靜態分析,還能實際執行程式碼來驗證邏輯與安全性。這種動態驗證機制能有效捕捉傳統 LLM 審查容易忽略的執行階段錯誤,為開發者提供更可靠的程式碼品質保障。

Google AMIE 醫療 AI 研究發表:表現媲美基層醫師
Google 在《Nature》期刊發表研究,指出其醫療對話式 AI 系統 AMIE 在複雜疾病管理上的表現,已能與基層醫師匹敵。這項突破顯示生成式 AI 在臨床決策支援領域的成熟度,為未來醫療輔助工具的發展奠定重要基礎。
今日洞察
AI產業正邁向效能優化與安全治理並重的新階段。Anthropic與Z.ai分別透過工具迭代與開源高性價比模型,降低應用門檻並提升開發效率,顯示市場競爭焦點轉向實用性與成本平衡。然而,Copilot漏洞事件警示LLM整合外部工具時的安全架構缺陷,凸顯防護機制亟待強化。與此同時,OpenAI Academy推動技能教育,而KV Cache可編輯性及多Agent系統驗證研究,則從底層技術與理論層面提升模型可控性與可靠性。整體而言,產業需在加速部署與確保安全穩定之間取得精確平衡,以支撐更複雜的AI應用生態。
🔮 趨勢雷達
未來三至六個月,AI 產業將從單純追求模型規模轉向效能優化與安全治理。GLM-5.2 的低成本開源策略將迫使歐美競品加速降價,開源模型在企業級編程領域的市佔率將顯著提升。同時,Copilot 漏洞事件將引發監管緊縮,企業對 AI 整合外部工具的審計標準將大幅提高,安全合規成本成為新門檻。技術層面,KV Cache 編輯技術將解決推理延遲瓶頸,使即時互動應用在 Q3 成為主流。此外,OpenAI 的教育佈局顯示市場焦點將轉向 Agent 工作流落地,缺乏實際應用場景的純模型公司將面臨投資降溫,具備系統整合與安全驗證能力的平台將主導市場。