新聞 3 / 8

產品發佈

Gemini API File Search 現已支援多模態

Gemini API File Search is now multimodal

Gemini API File Search 現已支援多模態

Hacker News · 2026-05-10

摘要

Google 宣布 Gemini API 的 File Search 功能正式升級為多模態,意味著開發者現在可以上傳圖片、影片等非文字檔案,讓 AI 模型直接理解其中的視覺內容。這項更新打破了以往僅能處理純文字文件的限制,大幅提升了 AI 在處理複雜文件庫時的準確度與實用性,特別適合需要結合圖文資訊的企業級應用場景。

開發者:可立即在 API 中整合圖片與影片搜尋能力,優化 RAG 系統

投資人:Google Cloud AI 服務競爭力強化,有利企業客戶留存

一般用戶:未來使用 Google 服務時,AI 能更精準地從個人檔案中找出相關資訊

重要性評分

73/100

🟠 值得關注

Gemini多模態File SearchAPI 更新Google Cloud
原文出處
上一則OpenAI 推出 GPT-5 等級推理能力的即時語音模型,重塑語音代理架構下一則Anthropic 營收達 300 億美元年化,創 80 倍驚人成長

喜歡這篇?每天早晨還有更多。

訂閱 5min AI,讓 AI 替你追蹤整個 AI 世界。

相關指南

🤖 本文摘要由 AI 自動生成,內容源自原始報導。如有疑慮,請參閱關於我們

喜歡這篇?每天早晨還有更多。

訂閱 5min AI,讓 AI 替你追蹤整個 AI 世界。