📰 2026-06-12 AI 日報

DiffusionGemma 想讓 AI 同時說 256 個字,但「逐字思考」其實才是 LLM 的根
阿凱📝 主編觀點 · 反直覺觀點 — 大家都這樣想,但其實可能不是這樣

DiffusionGemma 想讓 AI 同時說 256 個字,但「逐字思考」其實才是 LLM 的根

Google 上週推出 DiffusionGemma,把圖像生成的 diffusion 原理搬進文字模型——簡單說,就是不再一個字一個字吐,而是同時生成 256 個 token,中間還能自我修正。技術層面很炸,VentureBeat 報導裡形容這是「打破自迴歸架構的根本限制」。 問題是,這個「限制」,可能根本不是限制。 大家普遍的直覺是:逐字生成太慢了,平行生成才是未來。但這個直覺忽略了一件事——LLM 目前最強的能力,比如 chain-of-thought 推理、複雜數學、程式除錯,全都建立在「前一個 token 影響後一個 token」這個機制上。你讓模型同時說 256 個字,等於在它還沒想清楚第 1 個字的時候,就被迫先說好第 256 個字。 這有點像讓人用填空題格式寫偵探小說,兇手是誰還沒推理,就得先把結局寫進去。 Diffusion 在圖像生成之所以成功,是因為一張圖片的每個像素可以「獨立存在」,不需要知道左邊的像素才能決定右邊的。但語言不是這樣運作的。「這隻狗很___」後面要填什麼,完全取決於上下文——如果改成「這隻狗很__,但牠其實是一隻貓」,第一個空格的答案就整個不同了。 Google 自己也承認,DiffusionGemma 目前在創意寫作和流暢度上表現不錯,但在需要精確推理的任務上還跑不贏傳統自迴歸模型。這句話翻譯過來就是:快是真的快,但準不一定。 更值得注意的是時機點。現在正是 Reasoning Model 當道的時刻——OpenAI 的 o3、Anthropic 的 Claude Fable 5 都在把推理時間拉長,讓模型「想久一點」換取更正確的答案。DiffusionGemma 的方向幾乎是正好相反的:把生成時間壓縮,換取速度。 這兩條路不是非此即彼,但哪條路才是 AI 下一個真正的突破,現在押注還太早。 平行生成 256 個 token 聽起來像在賽跑贏了,但 AI 真正的戰場,從來不是速度。
Anthropic 開放 Mythos,但我們準備好了嗎?
塵子💬 塵子觀點

Anthropic 開放 Mythos,但我們準備好了嗎?

Anthropic 終於讓公眾能用上他們最強的 Mythos 系列模型。技術民主化的路上算是走了一大步,但問題跟著來了:當所有人都能輕易調用這種等級的 AI,我們真的知道自己在做什麼嗎? 這就像把一把主廚刀遞給剛學會剝水煮蛋的人,還附上一本《米其林三星料理指南》。過去我們擔心 AI 太笨,現在擔心的是它太聰明卻沒邊界。Mythos 開放之後,開發者可以更低成本整合強大模型,但原本被技術門檻擋住的那些創意,當然也包括惡意,也同時解鎖了。當任何人都能生成邏輯嚴密、語氣精準、極具說服力的內容,網路上的資訊環境會變成什麼樣子,我不太敢想。 這不只是技術問題,是信任危機。當 AI 能模擬任何人的語氣、風格甚至思維模式,螢幕那頭是真人還是精心調校過的程式,你還分得清楚嗎?或者說,你還在乎嗎? Anthropic 的動作也確實壓到了對手。OpenAI 已在考慮降價回應。但價格戰背後藏著一個更根本的問題:當 AI 同時變得普及又強大,「真實」和「人工」之間的界線要怎麼定義?也許我們該問的不是 AI 能做什麼,而是我們還想不想保留那些需要時間、笨拙、真實犯錯才能得到的東西。 如果連思考都可以外包,剩下的我們,還能做什麼?
🚀 產品速報2026-06-12

Anthropic 開放 Mythos 級 AI 模型,技術民主化邁出關鍵一步

Anthropic 正式宣布將高階的 Mythos 系列 AI 模型向公眾開放,這標誌著該公司在技術普及策略上的重大轉折。過去,Anthropic 的頂級模型主要受限於企業客戶與研究夥伴,僅有少數開發者能接觸其核心能力。此次開放公眾訪問,意味著開發者、研究人員乃至一般使用者,都能夠直接調用具備強大推理與生成能力的 Mythos 模型,大幅降低了使用先進人工智慧技術的門檻。 先說最重要的功能亮點。第一,Mythos 系列代表了 Anthropic 在大型語言模型架構上的最新突破。該模型不僅在自然語言處理的準確性與語境理解上表現卓越,更在複雜邏輯推理、程式碼生成以及多模態任務處理上展現出顯著優勢。對於需要處理高難度邏輯問題的開發者來說,這意味著可以更依賴模型來輔助解決複雜的技術難題,而不僅僅是簡單的對話或文本生成。...

西班牙銀行 BBVA 與 OpenAI 合作推進 AI 金融應用,同時 Anthropic 的 Claude 也將被整合進銀行與航空等受監管產業,AI 在金融領域的滲透加速。Google 卻因未經授權使用 YouTube 創作者音樂訓練 Lyria AI 模型而遭控訴,引發業界對 AI 訓練數據合法性的關注。在醫療與生活應用層面,開源醫療視覺語言模型 OpenMedQ 取得突破,DoorDash 推出 AI 聊天機器人增強用戶體驗。

BBVA 攜手 OpenAI 打造 AI 驅動的銀行未來

BBVA 攜手 OpenAI 打造 AI 驅動的銀行未來

西班牙銀行集團 BBVA 與 OpenAI 建立深度合作,已將 ChatGPT Enterprise 部署至 10 萬名員工,藉此加速全球銀行業的 AI 轉型。這標誌著傳統金融機構對生成式 AI 的大規模採用,不僅提升內部運營效率,更預示著客戶服務和產品創新即將發生革命性變化。

BBVAChatGPT Enterprise金融科技
OpenAI Blog
Google 被控非法使用 YouTube 創作者音樂訓練 Lyria AI,拒絕坦承事實

Google 被控非法使用 YouTube 創作者音樂訓練 Lyria AI,拒絕坦承事實

獨立音樂創作者集體訴訟 Google,指控其在未授權的情況下使用上傳至 YouTube 的歌曲來訓練 Lyria 3 音樂 AI 模型。Google 目前拒絕承認這項做法,但事實上幾乎所有上傳到 YouTube 的音樂內容都被納入 AI 訓練資料,這引發了關於創意工作者權益保護和 AI 訓練資料來源透明度的重大爭議。

Google Lyria著作權爭議AI 訓練資料
The Verge AI
DXC 將把 Claude 整合至銀行、航空等受監管產業的系統

DXC 將把 Claude 整合至銀行、航空等受監管產業的系統

DXC Technology 宣布將 Anthropic 的 Claude AI 模型整合到銀行、航空和其他受監管行業所依賴的關鍵系統中。這標誌著 Claude 從消費端進一步深入企業級和高風險應用領域,展現其在滿足嚴格合規要求方面的能力。

Claude企業級應用受監管產業
Anthropic Blog
OpenMedQ:醫療視覺語言模型的開源預訓練突破

OpenMedQ:醫療視覺語言模型的開源預訓練突破

研究團隊發布 OpenMedQ,這是迄今為止基於最廣泛開源醫學數據集的視覺語言模型,整合了 14 個數據集共 335 萬個預訓練樣本,涵蓋病理學、放射學、顯微鏡成像和臨床問答。該模型在 PathVQA 任務上取得 75.9 的 BLEU-1 分數,超越參數量大 80 倍的 Med-PaLM M,並在醫療影像分類基準測試中達到最高的宏平均 F1 分數 0.757。

醫療視覺語言模型開源預訓練醫學影像分析
arXiv cs.AI
Google 將保存 Lens 照片、Search Live 錄音和 Translate 音頻用於 AI 訓練

Google 將保存 Lens 照片、Search Live 錄音和 Translate 音頻用於 AI 訓練

Google 推出新的「Search Services History」設定,將自動保存用戶透過 Google Lens 搜尋的圖片、Search Live 的錄音、Translate 的音頻等互動資料,用於改進 AI 模型。這項政策變更引發隱私考量,用戶需要主動調整設定才能禁止數據保存。

隱私政策數據收集AI 訓練
The Verge AI
容納缺陷:已部署的智能體 AI 框架無法滿足公開安全要求

容納缺陷:已部署的智能體 AI 框架無法滿足公開安全要求

研究團隊審計了 LangChain、AutoGPT 和 OpenAI Agents SDK 三大主流框架,發現它們在建築層級上都未能提供結構化安全保障。特別是記憶完整性防護在三個框架中都不存在,容易被記憶投毒攻擊,導致政府服務、醫療分診、金融顧問等公開部署的智能體系統面臨持久的目標性損毀風險。

智能體安全LangChain記憶投毒
arXiv cs.AI
DoorDash 推出新 AI 聊天機器人,支援語音提示和圖片下單

DoorDash 推出新 AI 聊天機器人,支援語音提示和圖片下單

DoorDash 推出名為 Ask DoorDash 的 AI 聊天機器人,用戶可以用自然語言和上傳的食物照片來下單,無需逐個瀏覽餐廳和商店。這項功能降低了外送 App 的使用門檻,讓點餐體驗更直觀便利,代表大型消費應用正在將生成式 AI 整合到核心業務流程中。

AI聊天機器人消費應用自然語言處理
TechCrunch AI
Siri 不會成為你的 AI 女友——Apple 強調新 Siri 的克制設計

Siri 不會成為你的 AI 女友——Apple 強調新 Siri 的克制設計

Apple 在測試中展示新版 Siri 的設計理念:它知道何時該保持沉默,不會像 OpenAI 和 Google 的聊天機器人那樣過度討好用戶。Apple 執行長 Craig Federighi 強調,新 Siri 將採取更節制的風格,避免陷入對用戶言聽計從的陷阱,展現了 Apple 在 AI 語音助手上的不同哲學。

SiriAI 助手Apple 策略
The Verge AI
Jeff Bezos 投資 41 億美元打造「人工通用工程師」

Jeff Bezos 投資 41 億美元打造「人工通用工程師」

Jeff Bezos 領導的投資計畫宣布投入 41 億美元開發人工通用工程師(artificial general engineer),目標是建立能自主執行複雜工程任務的 AI 系統。這代表大科技巨頭對 AGI 應用的重大押注,將 AI 能力從純粹的語言處理擴展到實務工程領域。

人工通用工程師AGI應用Bezos投資
The Rundown AI
Anthropic 發佈關於 AI 對社會影響的深度分析,探...

Anthropic 發佈關於 AI 對社會影響的深度分析,探...

Anthropic 發佈關於 AI 對社會影響的深度分析,探討 AI 技術在日常生活、職場、教育與社會結構中帶來的實際轉變。報告涵蓋 AI 如何重塑產業生態、改變工作型態,以及可能引發的社會挑戰與機遇。

AI社會影響職場轉變AI倫理
Anthropic Blog
SpaceX IPO 的三大硬科技月球計劃:太空資料中心成核心價值

SpaceX IPO 的三大硬科技月球計劃:太空資料中心成核心價值

SpaceX 即將進行 IPO,其估值的核心驅動力是公司雄心勃勃的太空資料中心計劃,而非單純的火箭發射業務。這代表太空基礎設施領域正在進化,從傳統衛星通訊朝向更高層次的計算和資料處理應用轉變,反映了商業太空產業與新興科技的深度融合。

SpaceX太空資料中心商業太空
TechCrunch AI
PyTorch 效能分析實戰:從 nn.Linear 到融合 MLP

PyTorch 效能分析實戰:從 nn.Linear 到融合 MLP

Hugging Face 部落格發表 PyTorch 效能分析系列第二篇,深入探討如何將標準的 nn.Linear 層優化為融合 MLP(Fused MLP)以提升運算效率。這篇文章提供了具體的技術指南,幫助開發者透過自定義算子與記憶體優化技巧,顯著降低模型推理延遲並提高吞吐量,是進行 PyTorch 模型部署優化的重要參考。

PyTorch效能優化融合 MLP
Hugging Face Blog

今日洞察

AI 產業正處於技術突破與市場競爭雙軌並行的關鍵轉折點。Anthropic 開放 Mythos 模型與 OpenAI 考慮降價,顯示大廠正透過技術民主化與價格戰激烈搶奪企業用戶,市場進入白熱化階段。同時,GPT-5.5 在複雜代理任務基準測試中勝出,凸顯 Agent 能力成為新競爭核心。技術層面,Google DiffusionGemma 打破逐字生成限制,結合 PyTorch 效能優化與 Agent 實作指南,不僅提升運算效率,更推動生成式 AI 架構革新。整體而言,產業焦點已從單純模型規模競賽,轉向成本效益、代理智能及底層技術優化的綜合實力比拼。

🔮 趨勢雷達

未來三至六個月,AI 產業將從單純的模型競賽轉向效能與成本的雙重博弈。Anthropic 開放 Mythos 與 OpenAI 考慮降價,預示著高階模型服務將迎來白熱化的價格戰,迫使企業重新評估 AI 部署的邊際成本。同時,Google DiffusionGemma 的出現與 PyTorch 優化技術的普及,標誌著推理效率成為新的競爭壁壘,開發者將加速採用融合算子與平行生成架構以壓低延遲。此外,GPT-5.5 在長任務基準測試的領先,確認了具備自主規劃能力的 AI Agent 將成為企業級應用的主流標準,投資重心將從基礎模型訓練轉向代理程式的實作與優化,市場將更看重解決複雜工作流的實際落地能力。

延伸閱讀