📰 2026-06-18 AI 日報

中國開源模型用六分之一的錢打趴 GPT-5.5,這才是 AI 軍備賽最值得怕的事
阿凱📝 主編觀點 · 產品思維 — 哪個 AI 產品做對了什麼,我們能學到什麼

中國開源模型用六分之一的錢打趴 GPT-5.5,這才是 AI 軍備賽最值得怕的事

Z.ai 上週發布了 GLM-5.2,7530 億參數,長程自主編程能力在多項基準測試超過 GPT-5.5,開源、免費放上 Hugging Face,API 成本只有競品的六分之一。 這個消息在英文圈的討論熱度,比它應得的還要低很多。 先把數字放在這:GPT-5.5 的 API 費用已經不便宜,而 GLM-5.2 用六分之一的成本就能達到甚至超越它在編程任務上的表現。對於那些正在搭建 AI 開發助手、做 code review 自動化、或跑大量工程任務的團隊來說,這個差距不是小事,是直接影響到要不要換掉整個 infra 的商業決策。 更麻煩的是,這不是第一次發生了。DeepSeek 去年底用低成本開源模型震驚市場,現在 Z.ai 又來一次。中國 AI 公司正在建立一套固定劇本:針對特定任務垂直優化、開源釋出拿社群聲量、API 定價大幅低於美國競品。每次循環,美國這邊的壁壘就薄一點。 從產品思維來看,這裡有個值得學的邏輯:GLM-5.2 沒有想要在所有任務上打敗 GPT-5.5,它只鎖定「長程自主編程」這一個場景。把資源押注在一條垂直賽道,然後在那條賽道上做到讓人沒有理由不用你——這才是開源模型真正危險的地方。通用大模型打的是全面戰,但開源垂直模型打的是你最在意的那 20% 工作量。 OpenAI 和 Anthropic 當然不是省油的燈,他們的護城河在於生態系、企業信任、資料安全合規。但對個人開發者和中小型團隊來說,這些護城河的重量遠遠比不上「便宜六倍」這個事實。 GLM-5.2 真正宣告的,不是 GPT-5.5 輸了,而是「旗艦模型定價」這件事正在被系統性地瓦解。
Copilot 幫你查資料,順便把你的 2FA 驗證碼偷走
塵子💬 塵子觀點

Copilot 幫你查資料,順便把你的 2FA 驗證碼偷走

這不是電影情節,是 Ars Technica 昨天報導的真實漏洞。研究團隊發現一種叫 SearchLeak 的攻擊手法,駭客只要透過 Microsoft Copilot 的搜尋功能,就能竊取使用者的雙因素驗證碼。 我們習慣把 Copilot 當超級秘書,以為它就是個會聊天的工具。但這個漏洞揭露了一件事:當 AI 開始幫你「執行搜尋」這個動作,它其實已經進了你的私人領域。 問題不在於 AI 變笨,而在於它太勤勞。為了給你完整的答案,Copilot 會自動開瀏覽器、輸入關鍵字、點開連結。在這個過程中,它看到了你正在驗證的帳號、你正在瀏覽的敏感頁面。對 AI 來說,這些只是資料;對駭客來說,這些是鑰匙。 這就像你請人代收掛號信,結果對方順手把你的身分證影本傳給第三方——你以為省了時間,其實正在把帳號底細拱手讓人。 業界現在還在討論怎麼讓 AI 更聰明、更準確,卻少有人認真問:當 AI 擁有執行權限,我們該信任它到哪一步?現有的防護機制,基本上是用紙糊的門去擋專業小偷。 下次 Copilot 說「我幫你找到答案了」,別急著開心。先想想,它為了這個答案,到底看到了哪些不該看的東西。 SOURCE: Copilot 嚴重漏洞遭駭客利用,可竊取使用者 2FA 驗證碼
🚀 產品速報2026-06-18

Anthropic 大改 Claude Design:設計開發雙向同步,終於不燒錢了

AI 設計工具 Claude Design 在短短一週內就吸引了超過百萬用戶,這股熱潮讓 Anthropic 決定趁熱打鐵,推出了一項重大更新。這次改版不只是修修小 bug,而是從單純的視覺生成工具,正式轉型為支援完整設計與開發協作流程的平台。對於一直擔心 AI 工具太貴、太難落地的開發者和企業來說,這次更新直接解決了最痛的两个問題:Token 消耗太快,以及設計與程式碼無法互通。 先說最重要的功能:程式碼往返編輯。過去用 AI 生成 UI 時,最尷尬的情況是設計師滿意了,但工程師拿到程式碼後發現很難維護,或者工程師改了程式碼,設計師那邊卻不知道。現在,Claude Design 支援雙向同步。開發者可以直接在生成的程式碼中進行修改,這些變更會自動同步回設計稿中;反之,設計師在設計稿上的調整,也能反映在程式碼裡。這種閉環協作機制打破了設計與開發之間的壁壘,大幅減少了重複勞動,讓 AI 生成的成果真正具備工程落地的價值。...

Anthropic 推出 Claude Design 重大更新並解決 Token 消耗問題,同時 Z.ai 發布 GLM-5.2 開源模型,其長程編程能力超越 GPT-5.5 且成本大幅降低。然而,Copilot 嚴重漏洞遭駭客利用可竊取驗證碼,提醒開發者需高度警惕資安風險。此外,OpenAI Academy 推出新課程以培養下一世代工作技能,反映業界對 AI 應用人才的重視。

Anthropic 推出 Claude Design 重大更新:支援設計系統匯入、程式碼往返編輯,並解決 Token 消耗過快問題

Anthropic 推出 Claude Design 重大更新:支援設計系統匯入、程式碼往返編輯,並解決 Token 消耗過快問題

Anthropic 針對一週內即吸引百萬用戶的 Claude Design 工具進行重大改版,新增設計系統匯入與程式碼往返編輯功能,大幅提升設計與開發的協作效率。同時,此次更新也修正了先前引發關注的 Token 消耗過快問題,使工具在實用性與成本效益上更趨平衡。

AnthropicClaude Design設計系統
VentureBeat AI
Z.ai 發布 GLM-5.2 開源模型,長程編程能力超越 GPT-5.5 且成本僅為六分之一

Z.ai 發布 GLM-5.2 開源模型,長程編程能力超越 GPT-5.5 且成本僅為六分之一

中國 AI 新創 Z.ai 正式推出擁有 7530 億參數的 GLM-5.2 大型語言模型,該模型專為長程自主編程與工程任務設計,並在多項基準測試中表現優於 GPT-5.5。作為開源權重模型,GLM-5.2 不僅在 Hugging Face 上免費提供,其 API 服務成本也僅為競爭對手的六分之一,這將顯著降低企業與開發者部署高階 AI 編程助手的門檻。

GLM-5.2Z.ai開源模型
VentureBeat AI
Copilot 嚴重漏洞遭駭客利用,可竊取使用者 2FA 驗證碼

Copilot 嚴重漏洞遭駭客利用,可竊取使用者 2FA 驗證碼

研究團隊發現名為 SearchLeak 的漏洞,駭客可透過 Microsoft Copilot 的搜尋功能竊取使用者的雙因素驗證(2FA)代碼。此事件凸顯了當前大型語言模型(LLM)在整合外部工具時,對於敏感資訊防護的架構性缺陷,顯示業界在 AI 安全領域的防護措施仍嚴重不足。

CopilotAI 安全2FA 漏洞
Ars Technica AI
OpenAI Academy 推出新課程,打造下一世代工作技能

OpenAI Academy 推出新課程,打造下一世代工作技能

OpenAI 正式推出三門新的 Academy 課程,專注於培養實用的 AI 技能、建立可重複的工作流程,以及將 AI Agent 應用於日常工作中。這標誌著 OpenAI 從單純提供模型轉向系統化教育,旨在降低使用者掌握先進 AI 工具的門檻,並推動企業與個人更高效地整合 AI 於工作流程中。

OpenAIAI 教育Agent
OpenAI Blog
KV Cache 可編輯與組合:模型在 Prefill 階段會做筆記

KV Cache 可編輯與組合:模型在 Prefill 階段會做筆記

最新研究揭示,大型語言模型在 Prefill 階段不僅是計算,更像是在寫筆記(KV Cache)。這些筆記具有可編輯性,透過修改特定欄位的 Key/Value 向量即可修正結論,且無需重新計算整個上下文。此外,這些筆記具備組合性,可將預先編譯的技能以 RoPE 重定位的方式嵌入任何上下文,大幅降低運算成本。

KV CachePrefill模型可編輯性
arXiv cs.LG
多 Agent LLM 系統並行異常的機械化驗證與預防

多 Agent LLM 系統並行異常的機械化驗證與預防

這項研究針對多 Agent LLM 系統中常見的狀態共享問題,形式化定義了四種並行異常(如陳舊生成、幻覺工具等),並利用 TLA+ 和 Verus 工具進行了機械化驗證。這是首次為這類運行時環境建立機器檢查的一致性層次結構,確保了檢測器的正確性。對於開發者而言,這提供了構建更可靠、無競爭條件的複雜 AI 系統的重要理論基礎與驗證方法。

Multi-AgentLLM形式化驗證
arXiv cs.LG
TREX:能實際執行程式碼的 AI 程式碼審查工具

TREX:能實際執行程式碼的 AI 程式碼審查工具

TREX 是一款開源的 AI 程式碼審查工具,其最大特色在於不僅僅是靜態分析,還能實際執行程式碼來驗證邏輯與安全性。這種動態驗證機制能有效捕捉傳統 LLM 審查容易忽略的執行階段錯誤,為開發者提供更可靠的程式碼品質保障。

TREXAI Code Review程式碼審查
Hacker News
Google AMIE 醫療 AI 研究發表:表現媲美基層醫師

Google AMIE 醫療 AI 研究發表:表現媲美基層醫師

Google 在《Nature》期刊發表研究,指出其醫療對話式 AI 系統 AMIE 在複雜疾病管理上的表現,已能與基層醫師匹敵。這項突破顯示生成式 AI 在臨床決策支援領域的成熟度,為未來醫療輔助工具的發展奠定重要基礎。

GoogleAMIE醫療 AI
Google AI Blog

今日洞察

AI產業正邁向效能優化與安全治理並重的新階段。Anthropic與Z.ai分別透過工具迭代與開源高性價比模型,降低應用門檻並提升開發效率,顯示市場競爭焦點轉向實用性與成本平衡。然而,Copilot漏洞事件警示LLM整合外部工具時的安全架構缺陷,凸顯防護機制亟待強化。與此同時,OpenAI Academy推動技能教育,而KV Cache可編輯性及多Agent系統驗證研究,則從底層技術與理論層面提升模型可控性與可靠性。整體而言,產業需在加速部署與確保安全穩定之間取得精確平衡,以支撐更複雜的AI應用生態。

🔮 趨勢雷達

未來三至六個月,AI 產業將從單純追求模型規模轉向效能優化與安全治理。GLM-5.2 的低成本開源策略將迫使歐美競品加速降價,開源模型在企業級編程領域的市佔率將顯著提升。同時,Copilot 漏洞事件將引發監管緊縮,企業對 AI 整合外部工具的審計標準將大幅提高,安全合規成本成為新門檻。技術層面,KV Cache 編輯技術將解決推理延遲瓶頸,使即時互動應用在 Q3 成為主流。此外,OpenAI 的教育佈局顯示市場焦點將轉向 Agent 工作流落地,缺乏實際應用場景的純模型公司將面臨投資降溫,具備系統整合與安全驗證能力的平台將主導市場。

延伸閱讀