📰 2026-05-23 AI 日報

AI 自己跑了 35 小時,你的工作只需要幾分鐘
阿凱📝 主編觀點 · 一般人指南 — AI 怎麼影響普通人的生活,非技術人該知道什麼

AI 自己跑了 35 小時,你的工作只需要幾分鐘

阿里巴巴上週發布的 Qwen3.7-Max,讓我停下來想了一下。這個模型不是什麼效能提升或跑分漂亮的例行更新——它能連續自主運行 35 小時,中間不需要人類插手。 35 小時是什麼概念?你睡一覺起來,刷個牙吃個早餐,這個 AI 還在幫你工作。 對一般人來說,這個門檻的突破比聽起來更有感。過去幾年大家用 ChatGPT 或 Claude,本質上是一問一答——你丟問題,它給答案,你再繼續下一步。這種模式要你全程在場,像是在監督一個很聰明但沒有主動性的實習生。但 Qwen3.7-Max 代表的是另一種模式:你給它一個目標,它自己拆解任務、執行、遇到問題自己修正,然後回來跟你說做完了。 你說:「幫我整理這 300 份客戶資料,找出有潛力的名單,寫好第一封開發信。」然後去過你自己的一天。 這不只是「AI 更聰明了」,而是 AI 開始可以承擔責任,而不是等待指令。 當然,現實沒有這麼美好。35 小時自主運行是在特定測試環境下的成績,真實世界的複雜任務會踩到各種奇怪的邊界。但這個方向是確定的:AI 工具正在從「助手」進化成「代理人」。助手需要你帶著走,代理人可以自己去。 對非技術背景的人,這意味著一件事:你和 AI 的互動方式,很快要從「對話」升級成「委託」。這需要一種新能力——不是打字速度快,而是懂得怎麼把一件事說清楚、設好邊界、知道什麼結果算成功。 把任務交代清楚,本來就是人類最難做好的事之一。
0.12% 的參數增量,解決了 AI 記性不好的問題
塵子💬 塵子觀點

0.12% 的參數增量,解決了 AI 記性不好的問題

你要 AI 推薦午餐,它熱情地報了一家三年前就倒閉的餐廳。問題不是它笨,是它記性太差。過去我們以為解決辦法是給它更大的記憶庫,像把書房從一層樓擴建到十層樓,但 Mind Lab 與大學團隊的最新研究發現,其實只要增加 0.12% 的參數,就能讓 AI 在長程任務中不再重複做同一件事。 這聽起來荒謬。你不需要換一本更厚的筆記本,只要把其中一頁換成更硬的紙,就能記住最重要的事。這個方案不需要像傳統 RAG 技術那樣即時翻閱海量外部資料,也不需要消耗大量 Token 來撐住上下文,就能讓 AI 在跨天任務中記得自己剛才做過什麼。 這解決了一個很實際的問題:AI 以前做任務做到一半就失憶,得重新輸入指令從頭來過。有了這 0.12% 的調整,它更像一個知道昨天報告做到第幾頁、今天該從哪裡接的工作者,而不是每次開工都像第一天上班。比起直接擴大上下文視窗,這個方法成本更低,表現也更穩定。 我們習慣以為 AI 變強靠的是堆更多資料、投更多算力。但這次的突破提醒了另一件事:人類記憶的運作方式從來不是記住每一秒的細節,而是抓住關鍵的轉折點。0.12% 的參數,模仿的正是這個邏輯。 當 AI 開始記得自己做過什麼,它就從一個每次對話都要重新認識你的工具,變成一個有脈絡可循的協作對象。它還是會犯錯,但至少不會犯錯之後還一臉無辜說「我不記得有這回事」。這 0.12%,改變的不只是記憶,而是可靠性。
🚀 產品速報2026-05-23

AI 法律風波平息與 3D 創作新紀元:Claude 結合 Blender 的突破

今天我們來聊聊兩件對科技界影響深遠的大事。首先是長期糾紛的落幕,Elon Musk 針對 OpenAI 的訴訟因法律時效屆滿而正式終結。這場源於 OpenAI 從非營利組織轉型為獲利性公司的爭議,曾讓市場充滿不確定性,如今時效問題讓法律戰畫下句點,讓 OpenAI 能更專注於技術發展,也為整個生成式 AI 領域帶來了穩定的競爭環境。 與法律風波的平息形成鮮明對比的是,Anthropic 推出的 Claude 模型展現了令人驚嘆的技術突破,特別是與開源 3D 建模軟體 Blender 的深度整合。這不僅是簡單的對話,而是讓 AI 真正進入了三維空間的創作領域。...

AI 應用持續擴展至新領域,Google 發佈的 AI 眼鏡原型機翻譯與導航功能接近完成,Anthropic 同步推進 AI 對齐研究,而新創公司 The Path 與 Calm 前員工合作推出更安全的 AI 心理治療服務。不過 AI 倫理爭議也日益升溫,從 NTSB 因 AI 復原已故飛行員聲音而暫閉檔案系統,到大學畢業典禮上學生對科技 CEO 推廣 AI 的抗議聲浪,顯示公眾對 AI 安全與應用邊界的疑慮持續發酵。

AI 被用於復原已故飛行員的聲音,NTSB 被迫暫時關閉檔案系統

AI 被用於復原已故飛行員的聲音,NTSB 被迫暫時關閉檔案系統

有人利用 AI 技術對駕駛艙錄音的頻譜圖進行處理,成功重建了已故飛行員的聲音。這一做法引發了美國國家運輸安全委員會(NTSB)的擔憂,導致其暫時限制了對案件檔案系統的訪問。這事件凸顯了 AI 語音合成技術在濫用風險方面的隱憂,尤其涉及敏感司法證據。

AI 語音合成飛航安全數位證據濫用
TechCrunch AI
Google AI 眼鏡原型機評測:Gemini 翻譯與導航功能接近完成

Google AI 眼鏡原型機評測:Gemini 翻譯與導航功能接近完成

Google 展示了 Android XR 眼鏡原型機,能直接在視野中疊加 Gemini 驅動的即時翻譯、導航等資訊。這款設備將 AI 功能無縫整合進日常視野,標誌著空間計算與 AI 的深度融合邁向商用階段。

Android XRGeminiAR眼鏡
TechCrunch AI
Anthropic 發佈關於 AI 對齐(Alignment...

Anthropic 發佈關於 AI 對齐(Alignment...

Anthropic 發佈關於 AI 對齐(Alignment)的最新思考與研究進展。該議題涉及如何確保先進 AI 系統的行為與人類價值觀一致,是 AI 安全領域的核心課題,直接影響未來 AI 模型的可靠性與可信度。

AI對齏AI安全Claude
Anthropic Blog
Google 發佈全能型 AI 模型,展現驚人多模態能力

Google 發佈全能型 AI 模型,展現驚人多模態能力

Google 推出新一代 Gemini 模型,具備「任意轉任意」的多模態能力,能夠理解和生成文字、圖像、影片等多種內容格式。這個模型的強大之處在於它可以直接處理不同類型的輸入輸出,相比現有方案需要多個分開的模型串接,大幅簡化了開發流程並提升了創意應用的可能性。

Gemini多模態 AI生成式 AI
The Verge AI
The Path:由 Tony Robbins 和 Calm 前員工創辦,推出更安全的 AI 心理治療服務

The Path:由 Tony Robbins 和 Calm 前員工創辦,推出更安全的 AI 心理治療服務

由知名勵志大師 Tony Robbins 和冥想應用 Calm 的前員工創辦的新創 The Path,推出專門用於心理健康的 AI 模型,在 Vera-MH 心理健康安全基準測試中得分 95 分,遠超現有消費級 AI 機器人的最高分 65 分。這標誌著 AI 在心理健康領域的安全性有了重大進展,有望為需要心理支持的用戶提供更可靠的解決方案。

AI 心理治療心理健康安全AI 倫理
TechCrunch AI
編碼的未來、「類固醇奧運」與 AI 驅動科學——The Download 週報

編碼的未來、「類固醇奧運」與 AI 驅動科學——The Download 週報

Anthropic 在倫敦開發者大會展示了 Code with Claude 的編碼能力,展現了 AI 輔助開發的未來方向。這則週報涵蓋編碼工具的演進、科技產業的競爭加速現象,以及 AI 在科學研究中的應用趨勢,反映整個科技生態正面臨深刻轉變。

Code with ClaudeAI 編碼助手開發者工具
MIT Tech Review
Google I/O 展示 AI 驅動科學研究的新方向轉變

Google I/O 展示 AI 驅動科學研究的新方向轉變

Google DeepMind 執行長 Demis Hassabis 在 Google I/O 大會上宣稱人類正站在「奇異點的山麓」,強調 AI 正在推動科學研究的範式轉變。這次演講揭示了 Google 在 AI 應用於科學領域的最新進展,從蛋白質折疊到材料發現等多個方向展開,預示著 AI 未來將如何改造科學研究的方法論。

AI 科學研究DeepMindGoogle I/O
MIT Tech Review
圓桌論壇:AI 能否學會理解世界?

圓桌論壇:AI 能否學會理解世界?

MIT Tech Review 舉辦討論會,探討 AI 公司如何建構真正理解外部世界的系統,突破現有大語言模型的侷限。世界模型(World Models)成為當前 AI 研究的焦點,業界認為這是向更強大 AI 系統邁進的關鍵方向。

世界模型大語言模型AI 理解
MIT Tech Review
OpenAI 推出 OpenAI for Singapore 合作計畫

OpenAI 推出 OpenAI for Singapore 合作計畫

OpenAI 與新加坡啟動多年期 AI 夥伴關係,旨在擴大技術部署、培育在地人才,並協助企業與公共服務導入 AI 解決方案。此舉標誌著 OpenAI 將資源聚焦於特定區域市場,推動當地數位轉型與人才生態系的建立。

OpenAI新加坡AI 夥伴關係
OpenAI Blog
OpenAI 破解 80 年數學信念

OpenAI 破解 80 年數學信念

OpenAI 的研究團隊成功解決了一個存在 80 年的數學猜想,展現了 AI 在複雜邏輯推理與數學證明領域的突破性能力。這項進展不僅驗證了 AI 作為研究助手的潛力,也為未來解決更艱深的科學難題開闢了新途徑。

OpenAI數學猜想AI 研究
The Rundown AI
大學畢業典禮上學生狂嗆科技CEO:讚揚AI招致噓聲連連

大學畢業典禮上學生狂嗆科技CEO:讚揚AI招致噓聲連連

2026年畢業典禮上,包括前Google CEO Eric Schmidt在內的科技高層因為在演講中讚揚AI而遭學生大聲嘲笑和打斷。這波viral影片潮反映了年輕世代對AI浪潮的不滿和擔憂,而這些推動AI發展的業界領袖似乎對此感到措手不及。

AI裁員風險科技業聲譽年輕世代反感
The Verge AI
Samsung 記憶體晶片員工談妥 34 萬美元年度獎金

Samsung 記憶體晶片員工談妥 34 萬美元年度獎金

Samsung 與半導體部門員工達成初步協議,員工平均年度獎金達 34 萬美元。這項協議結束了員工威脅發動為期 18 天罷工的談判,主要爭議點圍繞 Samsung 對半導體部門員工的獎金上限規定。

Samsung勞資談判半導體產業
The Verge AI

今日洞察

AI 產業正從單純的對話互動邁向具備自主執行與深度推理能力的代理時代。OpenAI 破解數學猜想與阿里 Qwen 實現長時自主運行,證實模型已能處理跨天任務及複雜邏輯,而參數微調技術更以極低成本解決了長期記憶難題。儘管 Google 搜尋更新暴露了語意過濾的副作用,且部分新創透過操弄營收指標來維持融資敘事,但這些挑戰並未阻礙技術迭代。隨著法律糾紛暫告段落,Claude 結合 3D 建模等新應用場景,顯示產業重心已轉向實際落地與效率優化,未來競爭將取決於誰能更穩定地將 AI 轉化為可持續的生產力工具。

🔮 趨勢雷達

未來三至六個月,AI 產業將從概念炒作轉向務實落地,自主代理(Agents)技術因 Qwen3.7-Max 的長時運行能力與低成本記憶優化方案,必於 Q3 成為企業自動化流程的主流標準。隨著數學證明突破與 3D 建模整合,AI 將從輔助工具躍升為核心研發引擎,迫使傳統軟體開發模式重組。然而,融資市場因 ARR 數據注水與搜尋引擎安全邊界模糊,將迎來嚴厲的估值修正,缺乏真實產出的投機性新創將被快速清洗。投資人將不再為敘事買單,而是聚焦於具備長程任務執行力與穩定性的技術實證,市場格局將迅速向具備自主規劃能力的頭部模型集中。

延伸閱讀