產品發佈
Gemini API File Search 現已支援多模態
Gemini API File Search is now multimodal

Hacker News · 2026-05-10
摘要
Google 宣布 Gemini API 的 File Search 功能正式升級為多模態,意味著開發者現在可以上傳圖片、影片等非文字檔案,讓 AI 模型直接理解其中的視覺內容。這項更新打破了以往僅能處理純文字文件的限制,大幅提升了 AI 在處理複雜文件庫時的準確度與實用性,特別適合需要結合圖文資訊的企業級應用場景。
●開發者:可立即在 API 中整合圖片與影片搜尋能力,優化 RAG 系統
●投資人:Google Cloud AI 服務競爭力強化,有利企業客戶留存
●一般用戶:未來使用 Google 服務時,AI 能更精準地從個人檔案中找出相關資訊
重要性評分
🟠 值得關注
喜歡這篇?每天早晨還有更多。
訂閱 5min AI,讓 AI 替你追蹤整個 AI 世界。
相關指南

ChatGPT vs Gemini:Google AI 還是 OpenAI 更好?
深入分析 ChatGPT vs Gemini 2026 最新表現。從功能、價格到生態系,全面比較 Gemini 和 ChatGPT 比較結果,解答 Google AI vs OpenAI 誰更適合你。
閱讀指南 →
Google Gemini Canvas 是什麼?完整介紹與使用教學指南
Google Gemini Canvas 是搜尋引擎中的 AI 創意工具,支援在 Google Search AI Mode 中直接編輯和創作內容。本指南詳解功能、使用方法與優勢比較。
閱讀指南 →
Google Sheets Gemini 怎麼用?告別繁瑣公式,自然語言自動生成圖表與數據分析實戰
想知道 Google Sheets Gemini 怎麼用?本文提供完整教學,教你如何用自然語言指令自動生成公式、分析數據及製作圖表,讓 Excel 技能不再重要,輕鬆提升工作效率。
閱讀指南 →🤖 本文摘要由 AI 自動生成,內容源自原始報導。如有疑慮,請參閱關於我們。
喜歡這篇?每天早晨還有更多。
訂閱 5min AI,讓 AI 替你追蹤整個 AI 世界。