OpenMedQ：醫療視覺語言模型的開源預訓練突破

OpenMedQ: Broad Open Pretraining for Medical Vision-Language Models

arXiv cs.AI · 2026-06-12

摘要

研究團隊發布 OpenMedQ，這是迄今為止基於最廣泛開源醫學數據集的視覺語言模型，整合了 14 個數據集共 335 萬個預訓練樣本，涵蓋病理學、放射學、顯微鏡成像和臨床問答。該模型在 PathVQA 任務上取得 75.9 的 BLEU-1 分數，超越參數量大 80 倍的 Med-PaLM M，並在醫療影像分類基準測試中達到最高的宏平均 F1 分數 0.757。

●開發者：可基於完全開源的醫學 Vision-Language 模型架構進行二次開發和微調

●投資人：醫療 AI 領域的開源方案成熟度提升，降低企業級應用的開發成本

●一般用戶：未來醫學影像診斷和臨床諮詢工具可能變得更精準且可負擔

重要性評分

78/100

🟠 值得關注

醫療視覺語言模型開源預訓練醫學影像分析

原文出處

上一則← DXC 將把 Claude 整合至銀行、航空等受監管產業的系統下一則DoorDash 推出新 AI 聊天機器人，支援語音提示和圖片下單 →

喜歡這篇？每天早晨還有更多。

訂閱 5min AI，讓 AI 替你追蹤整個 AI 世界。