📰 2026-05-05 AI 日報

RAG 快死了,但大多數工程師還不知道
阿凱📝 主編觀點 · 職涯衝擊分析 — 這對工程師、PM、設計師意味著什麼,該怎麼準備

RAG 快死了,但大多數工程師還不知道

VentureBeat 最近引用了一份 2026 年 Q1 的企業調查,結論讓人不舒服:RAG 架構正在撞牆。不是小修小補能解決的那種牆,是規模化之後系統性崩潰的那種牆。 如果你現在的工作跟 AI 應用開發有關,這件事跟你的職涯直接掛鉤。 先說清楚發生什麼事。RAG 的邏輯是「用向量資料庫存知識,需要時再撈出來餵給模型」。這套在早期很香,讓模型能回答公司內部文件的問題,不需要重新訓練。但當 AI Agent 要做的事情變複雜,需要跨越多步驟、多工具、多知識來源,RAG 的延遲和準確率就開始垮掉。你沒辦法在 Agent 執行到一半的時候,讓它等你去撈十筆向量再繼續。 現在業界在談的新方向叫「編譯階段知識層」——意思是把知識在系統啟動之前就預先整合進去,不是執行時才檢索。這有點像是把活字印刷換成鉛版印刷,速度快了,但也更不靈活,每次知識更新都要重新編譯。 對工程師和 PM 來說,這代表什麼? 如果你現在正在設計 AI 應用的架構,繼續押注 RAG-only 是在幫自己挖坑。未來 12 個月,懂得在 RAG、Fine-tuning、編譯期知識層之間做出正確取捨的人,薪水會跟不懂的人拉開一個世代的差距。這不是誇飯,Microsoft、Google、Anthropic 的客戶工程師職缺現在越來越強調的就是這類架構判斷力。 對 PM 來說更直接:你在評估 AI 功能的時候,問「用 RAG 做行嗎」已經不夠了。你要開始問「這個 Agent 的知識更新頻率是多少、延遲容忍是多少、失敗的代價是什麼」,然後才能選對架構。 有趣的是,這個轉變讓傳統後端工程師的編譯、建置、依賴管理的直覺突然變得值錢了。AI 時代繞了一圈,又回頭需要那些被前端工程師嘲笑太無聊的基礎建設思維。 懂 DevOps 的你,可能比那個只會調 prompt 的人更快搶到下一個機會。
AMEX 讓 AI 幫你刷卡,但帳單還是你在哭
塵子💬 塵子觀點

AMEX 讓 AI 幫你刷卡,但帳單還是你在哭

American Express 正在推一套新系統,讓 AI Agent 直接代替你購物付款。核心是兩個機制:Intent Contracts(意圖合約)定義 AI 被允許買什麼,Single-Use Tokens(一次性令牌)則是每筆交易專用的虛擬卡號,用完即廢。簡單說,就是在給 AI 一張臨時卡的同時,把它的購物清單也鎖死。 聽起來很安全。AI 確實不會因為睡前滑手機滑出情緒,然後多買三件同款T恤。但問題不在技術層面,而在這套設計的根本邏輯:它把購物從一個衝動的瞬間,變成了一個需要被事前審計的流程。AMEX 替你的消費行為裝了監視器,然後說這是為你好。 這裡有個諷刺的弔詭。我們長期抱怨信用卡公司不懂我們,推薦的回饋都不對味。現在他們終於懂了,懂到連你買什麼都要過 AI 的邏輯關卡。就像公司終於給你升職,但新職位的第一項任務是替自己的每筆開銷寫核銷說明。 AMEX 把這套東西稱為 Agentic Commerce。「Agent」這個字現在被加在各種產品名稱前面,像商標免費貼紙一樣,好像貼了就代表軟體有了自主意識。但實際上,這套系統只是把原本由人類承擔的決策風險,轉移給了演算法。如果 AI 依照合約買錯了東西,責任算誰的?是沒料到邊界案例的工程師,還是沒仔細設定規則的你? 我們以為 AI 會讓消費更自由,結果它可能只是把我們變成自己購物習慣的稽核員。下次 AI 助手問你「確定要買這個嗎」,別只當它是確認視窗,那可能是你在整筆交易裡唯一真正做決定的時刻。 SOURCE: AMEX 打造 Agentic Commerce 堆疊:以 Intent Contracts 與 Single-Use Tokens 確保 AI 交易安全
🚀 產品速報2026-05-05

OpenAI 重構 WebRTC 堆疊,打造低延遲語音 AI 基礎設施

OpenAI 最近在官方部落格中公開了一項關鍵技術突破,詳細分享了他們如何重構 WebRTC 堆疊,以解決即時語音 AI 的延遲與全球擴展問題。這項工程優化讓模型能實現無縫的對話輪替,顯著提升了語音互動的自然度與即時性,是大型語言模型向多模態語音過渡的關鍵基礎設施突破。 先說最重要的功能:極致降低延遲。傳統語音處理架構在面對大型語言模型時,往往因為網路協定與音訊處理流程的瓶頸,導致回應速度慢,影響人機對話的自然度。OpenAI 的工程團隊透過自研的音訊編解碼器與網路傳輸策略,大幅減少了從用戶語音輸入到模型生成回應之間的處理時間。這意味著當你對 AI 說話時,幾乎沒有停頓感,能感受到如同與真人對話般的即時反饋。...

OpenAI 推出低延遲 Voice AI 系統,白宮亦重新評估與 Anthropic 的對抗策略,顯示大廠與政府正加速布局下一代 AI 互動與安全框架。同時 AMEX 以 Intent Contracts 推動 Agentic Commerce,結合 DeepClaude 等新型 Agent 架構,標誌著 AI 正從輔助工具轉向自主執行商業任務的關鍵轉折。

OpenAI 如何打造低延遲、高規模的 Voice AI 系統

OpenAI 如何打造低延遲、高規模的 Voice AI 系統

OpenAI 在部落格中詳細分享了其重構 WebRTC 堆疊的技術細節,旨在解決即時語音 AI 的延遲與全球擴展問題。這項工程優化讓模型能實現無縫的對話輪替,顯著提升了語音互動的自然度與即時性,是大型語言模型向多模態語音過渡的關鍵基礎設施突破。

OpenAIVoice AIWebRTC
OpenAI Blog
DeepClaude:結合 DeepSeek V4 Pro 的 Claude Code Agent Loop

DeepClaude:結合 DeepSeek V4 Pro 的 Claude Code Agent Loop

DeepClaude 是一個開源專案,透過將 Anthropic 的 Claude Code 與 DeepSeek V4 Pro 模型串接,打造出一個自動化的程式碼代理迴圈。這種架構讓開發者能利用 DeepSeek 在程式碼生成上的高性價比與效能,同時保留 Claude 在複雜邏輯推理上的優勢,為 AI 輔助開發提供了一種新的技術路徑。

DeepSeekClaude CodeAgent Loop
Hacker News
Usage-based pricing 讓你心累?教你自建本地 AI 模型

Usage-based pricing 讓你心累?教你自建本地 AI 模型

這篇文章探討了當前主流 AI 服務按用量計費(Usage-based pricing)帶來的成本不可控問題,並提供了一套自建本地 AI 模型的解決方案。透過利用開源模型與本地部署,開發者與愛好者可以擺脫雲端 API 的費用綁架,實現更隱私且成本可控的 AI 應用體驗。

本地 AIUsage-based pricing開源模型
Hacker News
最佳 AI 語音轉文字應用程式評測與排名

最佳 AI 語音轉文字應用程式評測與排名

TechCrunch 針對多款 AI 驅動的語音輸入應用程式進行實測與排名,涵蓋郵件回覆、筆記記錄甚至程式碼編寫等場景。這類工具透過自然語言處理技術提升語音辨識準確度與上下文理解能力,為需要高效文字輸入的用戶提供了具體的比較基準與選擇建議。

AI 語音輸入語音轉文字應用程式評測
TechCrunch AI
白宮重新評估與 Anthropic 的對抗策略

白宮重新評估與 Anthropic 的對抗策略

白宮正重新審視其針對 Anthropic 的監管或法律行動,顯示政府對大型 AI 模型開發者的態度可能出現策略性調整。同時,Perplexity 推出新功能,讓企業能透過 AI 進行商業構想的壓力測試,為創業者提供新的驗證工具。

Anthropic白宮AI 監管
The Rundown AI
AMEX 打造 Agentic Commerce 堆疊:以 Intent Contracts 與 Single-Use Tokens 確保 AI 交易安全

AMEX 打造 Agentic Commerce 堆疊:以 Intent Contracts 與 Single-Use Tokens 確保 AI 交易安全

American Express 正在建構一套讓 AI Agent 能代表用戶進行購物與付款的系統,目前主要整合於其自身的支付網路中。該系統採用 Intent Contracts(意圖合約)與 Single-Use Tokens(一次性令牌)來強化交易的安全性与可追溯性,並積極參與如 Google 的 Agent Pay Protocol 等互操作性協議。儘管技術架構已初步成型,但核心運作仍被視為黑盒子,這可能影響未來的信任建立與審計透明度。

Agentic CommerceAmerican ExpressAI 支付
VentureBeat AI
Agentic AI 時代來臨:RAG 架構終結,編譯階段知識層成新趨勢

Agentic AI 時代來臨:RAG 架構終結,編譯階段知識層成新趨勢

隨著 Agentic AI 對即時情境理解的需求增加,傳統的 RAG(檢索增強生成)與向量資料庫管道已顯現瓶頸。VentureBeat 2026 年 Q1 調查指出,企業級 RAG 應用正面臨規模化牆,業界正轉向在編譯階段整合知識層的新架構,以提供更精準的上下文支援。

Agentic AIRAG向量資料庫
VentureBeat AI
Anthropic 發表 Economic Research:AI 對經濟的深層影響

Anthropic 發表 Economic Research:AI 對經濟的深層影響

Anthropic 發布了名為 Economic Research 的專題研究,深入探討人工智慧技術如何重塑全球經濟結構與勞動市場。這份報告不僅分析當前 AI 發展對生產力的實際貢獻,更預測未來幾年內產業鏈的變遷趨勢,為理解 AI 的宏觀影響提供了重要的學術與商業參考依據。

Anthropic經濟研究AI 影響
Anthropic Blog

今日洞察

AI 產業正加速從單純的模型競賽轉向基礎設施優化與應用落地。OpenAI 透過重構 WebRTC 解決語音延遲,標誌著多模態即時互動的關鍵突破;而 DeepClaude 等開源專案則透過模型串接,探索高性價比的開發輔助新路徑。同時,Usage-based pricing 引發的成本焦慮促使本地化部署興起,白宮對 Anthropic 的監管態度調整更顯現政策面的動態博弈。在商業應用端,AMEX 推動 Agentic Commerce 並引入意圖合約與一次性令牌以確保交易安全,顯示 AI Agent 正逐步滲透核心金融場景,儘管技術透明度仍是建立信任的挑戰。

🔮 趨勢雷達

未來三至六個月,AI 產業將從單純的模型競賽轉向基礎設施與商業閉環的深層整合。語音 AI 將因低延遲技術突破成為主流交互介面,取代部分文字輸入場景。同時,企業為規避雲端成本波動,自建本地模型與開源部署將顯著增加,Usage-based pricing 模式面臨挑戰。在應用層,Agentic Commerce 與程式碼代理迴圈將加速落地,但安全與審計透明度成為關鍵瓶頸。政府監管態度雖有調整,但對 AI 交易的黑盒子運作仍持審慎態度,這將促使支付與合約技術標準化,市場焦點將從效能轉向可信賴的自動化執行能力。

延伸閱讀