📰 2026-03-30 AI 日報

阿凱📝 主編觀點 · 技術趨勢解讀 — 技術上發生什麼,為什麼重要,背後的原理是什麼

ARC-AGI-3 出來了,但 AI 真的「會推理」了嗎?

ARC Prize 剛公布 ARC-AGI-3,刷新了整個 AI 評測榜單,各家模型開始搶著跑分。但這個消息背後有一件事值得多看一眼:ARC-AGI 這個測試本來就是為了「測 AI 做不到的事」而生的。 ARC-AGI 系列是 François Chollet(Keras 的作者)設計的,核心理念是:如果一個題目能被大量訓練資料覆蓋,它就不算真正的推理測試。每一道 ARC 題目都是邏輯圖形填空,讓人類看五秒就懂,但舊版 GPT 系列一度答對率低於 20%。 所以當 ARC-AGI-3 出來,然後馬上被刷新排行榜,聽起來很爽,但其實要小心解讀。刷榜不代表 AI 真的「會推理」——更可能的解釋是,模型架構和訓練策略進步了,讓它在這個特定格式的測試上表現更好。就像你刷了 100 套學測模擬題之後,不代表你的邏輯能力真的提升了,只是你更熟練這種題型了。 Chollet 本人其實也一直在擔心這件事。他設計 ARC-AGI 的初衷,是希望它成為一面「照妖鏡」,能區分真正的通用推理能力和過度擬合的模式識別。但每次 AI 模型有突破,他就得去更新測試,這幾乎已經變成一場貓鼠遊戲。 真正有意思的問題不是「誰在 ARC-AGI-3 上得第幾名」,而是「這些模型在沒見過格式的全新問題上,表現如何」。目前沒有哪家公司把這個數字拿出來講,因為那個數字通常沒那麼好看。 目前 AI 在推理能力上的進步是真實的,特別是 o3、Claude 3.7、Gemini 2.0 這一代確實在數學和程式邏輯上有肉眼可見的跳升。但「刷新 ARC-AGI-3 榜單」和「AI 接近 AGI」之間,還有很大的距離。 評測基準本身就是一個會被攻略的目標,這件事可能比任何榜單排名都更值得記住。
塵子💬 塵子觀點

Apple 讓 Siri 變成點餐機,連老街坊的台語都救不了

Apple 說 iOS 27 要讓 Siri 能接 Google Gemini 或 Anthropic Claude,這聽起來像是手機終於學會了「看人下菜碟」。以前 Siri 像個固執的老師傅,你問什麼她只回那幾句,現在她可以打電話給 Google 或 Anthropic 問個清楚,甚至幫你訂位、買票。這改變聽起來很美好,但仔細想想,這其實是把「誰最聰明」的決定權,從 Apple 手裡轉交給了市場上最會算計的商業公司。 這就像你原本只吃一家連鎖便當,現在餐廳老闆說:「沒關係,你可以點外賣,只要外賣送得夠快。」問題是,當 Siri 開始幫你跟不同公司對話,你的隱私數據到底流向了誰?Apple 說這只是技術整合,但 Anthropic 的付費用戶今年已經翻倍,這顯示大家真的願意為了更好的回答付錢。當你的手機開始幫你在不同 AI 之間切換,它其實是在幫你做選擇,而這個選擇背後,是商業利益的算計。 更有趣的是,當 Siri 能執行更複雜的任務,比如用 OpenAI 的插件幫你跨應用程式工作,它就不再只是個語音助手,它變成了你的私人助理。但這助理的忠誠度,取決於它背後的公司想賺多少錢。你以為你在用 Siri,其實你是在用一個由多個公司拼湊出來的「超級助理」,而這個超級助理的每一個決定,都可能藏著廣告或訂閱費的陷阱。 所以,下次 Siri 幫你訂位時,記得問問自己:這真的是為了你好,還是為了讓某個公司多賺一點訂閱費?技術進步了,但人類的選擇權,好像又變少了。
🚀 產品速報2026-03-30

Apple 開放 Siri 接入第三方 AI 模型,生態系統迎來重大轉折

今天我們來聊聊 Apple 在 Siri 上的一項重大更新。根據彭博社與 The Verge 的報導,Apple 預計在即將推出的 iOS 27 系統更新中,徹底改變 Siri 的運作模式。這項改變允許用戶透過 App Store 下載並整合第三方 AI 聊天機器人,例如 Google 的 Gemini 或 Anthropic 的 Claude,直接作為 Siri 的後端回應引擎。這標誌著 Apple 從過去堅持封閉生態系統,轉向開放策略的關鍵轉折點,不再將 Siri 的智力局限於自家開發的模型。 先說最重要的功能:模型無關的語音指令處理。在舊版 Siri 中,無論你問什麼,系統都強制調用 Apple 內建的語言模型。但在 iOS 27 中,當用戶對 Siri 發出複雜指令時,系統會根據用戶設定,將請求轉發至選定的第三方大模型。這意味著你可以選擇讓 Claude 來處理長文本分析,因為它在閱讀和理解長文章方面表現優異;或者讓 Gemini 來處理多模態任務,因為它在圖像與語音的結合上更具優勢。這種機制讓 Apple 能靈活調用市場上最優秀的 AI 技術,大幅提升 Siri 的實用性與準確度。...

ARC-AGI-3 的突破性能刷新了 AI 前沿評分,OpenAI 新插件功能也將編碼應用範圍大幅拓展,而 Anthropic 的 Claude 付費用戶數飆升反映出生成式 AI 商業化加速。Apple 開放第三方 AI 聊天機器人接入 Siri 意味著 AI 助手生態正在整合,但 TikTok 廣告識別困難與科技巨頭數據中心擴張帶來的能源衝突,也成為產業亟需解決的挑戰。

ARC-AGI-3 刷新 AI 前沿評分榜

ARC-AGI-3 刷新 AI 前沿評分榜

ARC-AGI-3 模型在最新評測中表現卓越,成功刷新了 AI 前沿的評分榜單,展現了強大的能力。雖然原始摘要提及 Slack 表情貼功能,但核心焦點在於模型能力的突破,這標誌著 AI 技術在通用智能領域邁向新里程碑。

ARC-AGI-3AI 前沿模型評測
The Rundown AI
Apple 將允許第三方 AI 聊天機器人接入 Siri

Apple 將允許第三方 AI 聊天機器人接入 Siri

根據彭博社報導,Apple 預計在 iOS 27 更新中開放 Siri 與第三方 AI 聊天機器人整合,使用者可從 App Store 下載如 Google Gemini 或 Anthropic Claude 等模型來回應 Siri 指令。這項改變標誌著 Apple 從封閉生態轉向開放策略,讓 Siri 不再僅限於自家模型,而是能靈活調用市場上最優秀的 AI 技術。

AppleSiriAI 聊天機器人
The Verge AI
Anthropic 的 Claude 付費用戶數量飆升

Anthropic 的 Claude 付費用戶數量飆升

Anthropic 未公開具體用戶總數,但確認 Claude 的付費訂閱數量今年已翻倍,顯示市場對其模型的接受度極高。這表明付費 AI 服務正從實驗階段轉向大規模商業化應用。

AnthropicClaude付費訂閱
TechCrunch AI
為什麼 TikTok 難以識別 AI 生成廣告?

為什麼 TikTok 難以識別 AI 生成廣告?

TikTok 目前缺乏有效機制來自動識別平台上的生成式 AI 廣告,導致用戶難以分辨內容真偽。這凸顯了當前生成式 AI 技術在深度偽造(Deepfake)方面的快速發展,已超越現有檢測工具的識別能力。此問題引發對平台監管責任與內容真實性的廣泛關注。

TikTok生成式 AI廣告識別
The Verge AI
OpenAI 推出新插件功能,將 Codex 應用範圍擴展至編碼之外

OpenAI 推出新插件功能,將 Codex 應用範圍擴展至編碼之外

OpenAI 正式推出插件功能,讓 Codex 不再僅限於編碼任務,而是能執行更廣泛的自動化操作。這項更新標誌著 AI 代理能力的重要躍升,使開發者能利用 AI 處理更複雜的跨應用程式工作流。

OpenAICodex插件功能
Ars Technica AI
數據中心、AI 與能源:科技巨頭的擴張與全球衝突

數據中心、AI 與能源:科技巨頭的擴張與全球衝突

科技公司正大規模興建數據中心以支撐 AI 發展,但這些能耗巨大的設施在全球各地引發爭議。從電網負荷、電費上漲到環境影響和社區反對,數據中心的快速擴張正成為一個無法迴避的問題,甚至有公司計劃將數據中心送上太空尋求新出路。

數據中心AI 基礎設施能源消耗
The Verge AI
Google Translate Live 功能正式登陸 iOS,耳機即時翻譯來襲

Google Translate Live 功能正式登陸 iOS,耳機即時翻譯來襲

Google 宣布其即時翻譯功能正式支援 iOS 系統,讓使用者能透過耳機實現跨語言的即時對話翻譯。此更新擴大了支援的國家範圍,標誌著即時語音翻譯技術在行動裝置上的普及化,大幅降低了語言溝通的門檻。

Google TranslateiOS即時翻譯
Google AI Blog
法官裁定:Hegseth 和 Trump 無權下令將 Anthropic 列入黑名單

法官裁定:Hegseth 和 Trump 無權下令將 Anthropic 列入黑名單

美國法院判決川普政府時期的國防部長 Hegseth 和川普本人沒有法律權力將 AI 公司 Anthropic 列入黑名單。法庭文件顯示國防部無法提出正當理由來支持這項決定,凸顯了行政部門濫權和企業言論自由保護的重要議題。

Anthropic言論自由政策爭議
Ars Technica AI
SoftBank 的 400 億美元貸款暗示 OpenAI 可能在 2026 年上市

SoftBank 的 400 億美元貸款暗示 OpenAI 可能在 2026 年上市

JPMorgan 和 Goldman Sachs 向日本軟銀集團提供 12 個月無擔保貸款,金額高達 400 億美元。這筆大額融資動作被分析師解讀為 OpenAI 可能在 2026 年進行首次公開發行的信號,反映華爾街對 OpenAI 長期價值和融資能力的看好。

OpenAIIPO融資
TechCrunch AI
VC 砸數十億美金投資 AI 浪潮,OpenAI 卻悄悄關閉 Sora?

VC 砸數十億美金投資 AI 浪潮,OpenAI 卻悄悄關閉 Sora?

AI 基礎設施擴張遇到現實阻力。當一位 82 歲肯塔基州婦女拒絕了 AI 公司的 2,600 萬美元收購地皮提議後,更大的問題浮出水面:VC 們狂投數十億美金到 AI 產業,但 OpenAI 卻在關閉視頻生成工具 Sora,顯示出投資熱潮與產品現實之間的矛盾。這反映出 AI 公司面臨的雙重困境——基礎設施需求與社區反對的衝突,以及產品策略的不確定性。

AI 基礎設施OpenAI Sora融資策略
TechCrunch AI
人類子宮首次在體外保持活性

人類子宮首次在體外保持活性

研究人員成功在體外保持人類子宮存活,使用一個類似不鏽鋼盒子的裝置,內部透過軟管模擬血管系統來維持器官的血液循環和營養供應。這項突破為器官移植和生育醫學開啟新可能,代表了生物工程在維持複雜人體器官方面的重大進展。

器官移植生物工程生殖醫學
MIT Tech Review
James Manyika 與 LL COOL J 對話 AI 與創意

James Manyika 與 LL COOL J 對話 AI 與創意

Google AI 邀請知名音樂人 LL COOL J 與 Google 高管 James Manyika 在「科技與社會對話」系列節目中深入探討 AI 對創意產業的影響。這場對談將創意表達與人工智能技術結合,展現 AI 在文化領域的應用前景。

AI 創意應用Google AI科技對話
Google AI Blog

今日洞察

AI 產業正經歷從技術突破到商業落地的關鍵轉折。ARC-AGI-3 刷新評分榜顯示通用智能邁向新里程碑,而 Apple 開放 Siri 整合第三方模型,標誌著生態系統從封閉轉向開放競爭。商業化進程加速,Anthropic 付費用戶翻倍與 Google 即時翻譯普及,證明高價值應用已大規模落地。同時,OpenAI 擴展 Codex 至自動化工作流,展現 AI 代理能力的躍升。然而,TikTok 難以識別 AI 廣告的困境,凸顯生成式技術發展已超越現有檢測機制,引發監管與內容真實性的嚴峻挑戰。整體而言,產業在技術與商業雙軌並行下,亟需建立更完善的治理框架以應對深度偽造等新風險。

🔮 趨勢雷達

未來三至六個月,AI 產業將從單純的模型競賽轉向生態整合與商業變現的實戰階段。隨著 Apple 開放 Siri 接入第三方模型,封閉生態壁壘將被打破,市場將迅速形成以 Google 和 Anthropic 為首的開放式 AI 服務聯盟,導致純技術型初创企業因缺乏平台入口而面臨融資降溫。同時,即時翻譯與 AI 代理插件的普及,將迫使企業在 Q3 前大規模部署自動化工作流,以應對人力成本壓力。然而,TikTok 暴露的深偽檢測困境將引發監管重拳,預計政府將在年底前強制要求平台建立 AI 生成內容標記機制,導致生成式廣告的投放成本大幅上升,無法通過合規驗證的企業將被逐出主流市場。

延伸閱讀