新聞 5 / 12

研究突破

MiniCPM-o 4.5:邁向實時全雙工全能態互動

MiniCPM-o 4.5: Towards Real-Time Full-Duplex Omni-Modal Interaction

MiniCPM-o 4.5:邁向實時全雙工全能態互動

arXiv cs.CL · 2026-05-01

摘要

MiniCPM-o 4.5 突破了多模態大型語言模型的交互瓶頸,實現了能同時看、聽、說的實時全雙工能力,打破了感知和響應交替進行的傳統模式。這個模型還具備主動行為能力,能在多模態環境中主動發出提醒或協作,代表著朝向人類般自然交互的重大進步。

開發者:可基於全雙工交互範式開發更自然的語音應用和實時協作工具

投資人:多模態互動技術領域正進入新階段,相關應用場景商業化潛力巨大

一般用戶:未來的語音助手和實時應用將更貼近真實對話,交互體驗將大幅提升

重要性評分

78/100

🟠 值得關注

多模態互動實時全雙工大型語言模型
原文出處
上一則Trump 大規模裁員風波波及美國科學基金會,22 名科學家委員會成員遭全數解雇下一則Apple 因 AI 需求大幅增長而面臨 Mac 供應短缺

喜歡這篇?每天早晨還有更多。

訂閱 5min AI,讓 AI 替你追蹤整個 AI 世界。

相關指南

🤖 本文摘要由 AI 自動生成,內容源自原始報導。如有疑慮,請參閱關於我們

喜歡這篇?每天早晨還有更多。

訂閱 5min AI,讓 AI 替你追蹤整個 AI 世界。