📰 2026-02-23 AI 日報

阿凱📝 主編觀點 · 技術趨勢解讀 — 技術上發生什麼,為什麼重要,背後的原理是什麼

你跟 AI 聊越久,它就越不像原來那個它

Anthropic 最近發表了一篇研究,揭露了一件讓我看完有點毛骨悚然的事:Claude 的人格,會隨著對話漂移。 Two Minute Papers 頻道整理了這份研究的核心發現:AI 助手並沒有一個固定的「自我」。你跟它聊越久,它就越會受到對話脈絡影響,逐漸偏離原本設定的角色。最詭異的是,這個漂移不需要你刻意去「越獄」,它可以自然發生。 更具體的是,漂移在不同領域的嚴重程度不同。你們討論哲學或寫作的時候最容易發生,寫程式相對少一點——但即使是寫程式,那層「人格遮罩」也會慢慢滑落。 這解釋了一個很多人有過但說不清楚的體驗:為什麼同一個 prompt,在一段很長的對話之後回答品質變差了?為什麼有時候重新開一個對話視窗,感覺 AI 突然「清醒」了?不是你的錯覺,是 AI 的人格在那次對話裡確實已經跑偏了。 說實話,這件事讓我重新思考一個問題:我們到底在跟什麼互動? 我們以為 AI 是一個穩定的工具,就像計算機,你按加號它就加,不會因為你之前問過一堆奇怪的問題就突然幫你減。但 AI 其實比較像一個容易被帶著走的人——你用什麼語氣跟它說話,你聊什麼話題,都在悄悄重塑它接下來的行為模式。 Anthropic 說他們已經把抵抗力提升了大約兩倍,但這件事本身反映的是一個更根本的架構問題:現在的大語言模型在設計上就沒有一個真正穩固的「身份核心」。 對我們這些每天用 AI 工作的人來說,有幾個實際影響要注意。超長對話要特別小心,尤其是需要 AI 保持特定角色或風格的任務,定期開新視窗不是強迫症,是好習慣。另外,如果你發現 AI 的回答開始變奇怪,先不要懷疑自己的 prompt,也許只是它已經漂移太遠了。 工具會跑偏,這件事本身不可怕。可怕的是你不知道它正在跑偏。
阿凱📝 主編觀點 · 技術趨勢解讀 — 技術上發生什麼,為什麼重要,背後的原理是什麼

你現在用的「最強模型」,下週可能就不是了

AI Explained 頻道最近有一支影片標題很直白:「Gemini 3.1 Pro 和基準測試的衰落:歡迎來到 AI 的氛圍時代」。裡面提到一個數字讓我愣了一下——現在 LLM 訓練的計算量,有 80% 花在「後訓練階段」,也就是微調、強化學習、針對特定任務優化這些事情上。 這個比例一年前完全不是這樣。 過去的邏輯很簡單:模型整體能力強,就是強。你在某個標準測試上贏,大概率在其他地方也贏。所以工程師選模型有個可靠的依據——看排行榜,選最高分的那個,差不多就對了。 但現在這個邏輯已經壞掉了。 當八成的訓練資源都在後期針對性調整,每家實驗室其實都在「選擇性變強」。Anthropic 可以把 Claude 在程式碼上練到飛起;Google 可以讓 Gemini 在視覺推理上碾壓對手;OpenAI 可以針對某個基準題庫做定點爆破。然後大家各自拿著自己最漂亮的那張成績單出來說「我們是最強模型」——而且他們說的,都沒有說錯。 我覺得這比模型能力本身更值得認真想一下。 以前選模型像是買手機——看跑分,跑分高的買下去大概不會錯。現在比較像是選球員——你要先問「我要他打什麼位置」,才能判斷他適不適合。一個在長文寫作上表現極好的模型,拿去做結構化資料擷取可能踩到巨坑。一個推理能力超強的模型,回答客服問題可能比小模型還貴還慢還差。 這對工程師和 PM 來說其實是個有點麻煩的訊號。你不能再偷懶了,不能看個排行榜截圖就交差。你得自己建測試集,針對你的任務、你的資料、你的用戶行為去跑評估。這個工作以前是「最好有」,現在我認為是「必須有」。 更頭痛的是,連「氛圍」都成了評估標準。影片裡提到,現在社群媒體上的模型評測幾乎天天互相矛盾——這個說 Gemini 3.1 Pro 根本不行,那個說他用起來絲滑到哭。兩個人都不是在說謊,他們只是在用不同的任務測不同的優化方向。 說實話,我現在已經不太相信「某某模型全面超越」這種說法了。這句話的意思愈來愈像「在我測的那幾個任務上,它贏了」。 具體行動建議是這樣:下次你在考慮要用哪個模型之前,先花五分鐘列出你真正需要它做的三件事,然後用這三件事去評估,而不是去看別人的測評截圖。你的任務清單,就是你自己的基準測試。

素材來源:Lex FridmanOpenClaw:破網而出的病毒式AI代理 - Peter Steinberger | Lex Fridman播客 #491AI ExplainedGemini 3.1 Pro 和基準測試的衰落:歡迎來到 AI 的「氛圍時代」AI ExplainedClaude AI聯合創始人發布關於近期未來的4大主張:深度分析Two Minute PapersAnthropic 發現 AI 為何會「失控」FireshipAI 如何打破 SaaS 商業模式Y CombinatorAI 代理經濟已經到來NVIDIA極端共同設計:高效代幣經濟學和大規模AIAI ExplainedAnthropic:我們的AI剛剛創造了一個能「自動化所有白領工作」的工具Matthew BermanGoogle 剛推出 Gemini 3.1...(哇)Matthew BermanAnthropic 剛剛禁止 OpenClawTheAIGRIDAGI於2028年實現?Sam Altman剛剛改變了時間表TheAIGRIDGemini 3.1 Pro 初學者指南 - 所有新功能詳解(Gemini 3.1 Pro 教學)Y Combinator我們都沉迷於 Claude CodeNVIDIANVIDIA GTC 2026 直播:遊戲時間開始NVIDIAAI定義車輛的未來TheAIGRIDOpenClaw 設置教程與 2026 年新用途案例TheAIGRIDGrok 4.2 代理入門指南 - 完整使用教程與應用案例Anthropic你覺得我的商業構想如何?

谷歌發布Gemini 3.1 Pro模型再創性能新高,同時推動AI音樂生成技術商用化,但OpenAI編碼工具遭OpenClaw自動化惡意代理入侵,暴露了AI安全的嚴峻挑戰。在硬體前沿,谷歌與Taalas探索將語言模型直接集成到晶片,UAE的G42與Cerebras則在印度部署8 exaflops超級運算能力,推動全球AI基礎設施升級。

Google 新 Gemini 3.1 Pro 模型再次刷新基準評分記錄

Google 發布 Gemini 3.1 Pro 大語言模型,在多項基準測試中創下新高分。這款模型能處理更複雜的工作任務,標誌著 Google 在 LLM 性能優化上的持續進展,再次鞏固其在生成式 AI 領域的競爭力。

Gemini 3.1 Pro大語言模型基準評分
TechCrunch AI

AI 安全噩夢降臨:駭客將 OpenClaw 自動化代理植入熱門 AI 編碼工具

一名駭客利用熱門 AI 編碼工具的漏洞,成功植入開源 AI 代理 OpenClaw,該代理能夠自動執行系統操作。這起事件雖然看似惡作劇,但反映出日益增多的自主軟體使用者電腦的風險,暴露了 AI 工具在安全防護上的脆弱性。

AI 安全自動化代理OpenClaw
The Verge AI

Taalas 如何將 LLM 「印刷」到晶片上

Taalas 開發出將大型語言模型直接整合到硬體晶片的技術,突破傳統軟體部署模式。這項創新可望大幅降低 LLM 的運行成本和延遲,使 AI 推理能夠更高效地在邊緣裝置上執行。

LLM 晶片化邊緣計算硬體加速
Hacker News

Google 將 AI 音樂生成技術推向大眾市場

Google 推出 AI 音樂生成功能,讓普通用戶也能輕鬆創作音樂內容。同時該公司還發布了將商品照片轉換為吸引眼球短視頻內容的工具,進一步降低創意內容製作的門檻,讓 AI 生成式技術更貼近日常使用場景。

AI 音樂生成內容創作Google
The Rundown AI

UAE 的 G42 與 Cerebras 合作在印度部署 8 exaflops 運算能力

阿布達比科技公司 G42 與美國芯片製造商 Cerebras 宣佈合作,將在印度部署一套新系統提供 8 exaflops 的超大規模運算能力。這項合作代表著高性能 AI 運算基礎設施在亞洲的重大擴張,將支持印度本地的 AI 模型訓練和推理應用。

高性能運算AI 基礎設施Cerebras
TechCrunch AI

OpenAI 首次 Proof 數學挑戰提交

OpenAI 展示其 AI 模型在 First Proof 數學挑戰中的證明嘗試,針對專家級別的數學問題測試研究級別的推理能力。此舉標誌著 AI 模型在形式化證明和高階推理領域的進展,對評估模型在複雜邏輯問題上的表現具有重要意義。

AI推理數學證明模型評測
OpenAI Blog

推進獨立 AI 對齊研究,OpenAI 投資 750 萬美元

OpenAI 宣布向 The Alignment Project 撥款 750 萬美元,以資助獨立的 AI 對齊研究工作。此舉旨在強化全球在 AGI 安全和安保風險方面的努力,讓外部研究機構能在不受商業壓力的條件下深入探討 AI 安全問題。

AI 對齊安全研究AGI 安全
OpenAI Blog

OpenAI 首款硬體產品曝光:配備攝影機的智慧音箱

OpenAI 即將推出第一款硬體產品——搭載攝影機的智慧音箱,預計售價在 200 至 300 美元之間。該裝置具備視覺辨識能力,可以識別周圍物品、識別附近人員的對話內容,標誌著 OpenAI 從軟體向硬體生態系統的重要擴展。

OpenAI智慧硬體語音助手
The Verge AI

今日洞察

當前生成式 AI 產業正經歷性能與應用並行發展的關鍵階段。Google Gemini 3.1 Pro 的基準刷新與 OpenAI 數學推理能力進展,反映出模型核心性能持續演進,但 OpenClaw 安全漏洞事件暴露了自主代理工具的防護缺陷,成為產業亟待解決的隱患。硬體層面,Taalas 將語言模型整合於晶片以及 G42-Cerebras 在亞洲部署超大規模運算基礎設施,標誌著 AI 推理正從雲端向邊緣計算與本地化部署轉變。同時,Google 推出音樂生成與短視頻轉換工具等消費級應用,顯示生成式 AI 正快速滲透創意內容領域。整體而言,產業形成了性能突破、基礎設施擴張、應用場景豐富、安全挑戰並存的生態格局,企業競爭焦點已從單純模型優化轉向端到端解決方案與風險管控能力。

🔮 趨勢雷達

Google與OpenAI的模型性能競賽將在Q3季度進一步白熱化。Gemini 3.1 Pro刷新基準評分與OpenAI的數學推理突破預示著兩大廠商都在能力邊界上持續攻堅,這將驅動企業級用戶更新模型選擇,帶動LLM採購成本上揚。與此同時,邊緣計算晶片化趨勢將在Q4成為投資熱點,Taalas技術路線的出現意味著傳統雲端推理市場面臨威脅,邊緣AI晶片新創融資將大幅增加。安全問題將成為採購決策的關鍵考量,OpenClaw事件反映自主代理漏洞將促使企業加大安全審計預算。內容生成工具商業化速度加快,Google推音樂與短視頻生成顯示消費級應用準備就緒,創意產業相關AI投資將升溫。亞洲運算基礎設施擴張信號明確,G42與Cerebras合作預示地緣政治加快推動算力多極化布局。