醫(yī)生與AI大模型的協(xié)同診療,正從技術概念走向臨床現(xiàn)實。普林斯頓大學團隊基于強化學習開發(fā)的ICU決策優(yōu)化模型,結合近期DeepSeek-R1、GPT-5等大模型在診斷環(huán)節(jié)的突破性表現(xiàn),共同勾勒出“人機協(xié)同”的新范式——人類醫(yī)生的全局經(jīng)驗與AI的高維計算能力互補,形成“1+1>2”的臨床決策升級。以下從核心技術、應用場景及未來挑戰(zhàn)三方面展開分析!
在高風險的醫(yī)療診斷領域,單純依賴大型語言模型(LLMs)或人類醫(yī)生都存在局限——LLMs 會幻覺、缺乏常識且有偏見;人類則受經(jīng)驗局限與知識覆蓋面的限制。本研究提出一種混合集體智能(Hybrid Collective Intelligence, HCI)方法,將醫(yī)生的臨床推理與 LLM 的信息處理能力結合,對 2,133 個真實感病例(含 40,762 份醫(yī)生診斷與 5 個最先進 LLM 的診斷輸出)進行加權融合。結果顯示,混合集體在所有專業(yè)與經(jīng)驗層級下的診斷準確率均顯著優(yōu)于人類單獨、AI 單獨及各自的集體形式。

每年美國約 79.5 萬例死亡或永久傷殘與診斷錯誤相關。盡管 LLM 在自然語言處理與多領域問答中表現(xiàn)出色,包括醫(yī)學在內(nèi)的眾多場景,但它們的結構性缺陷(如幻覺、偏見、缺乏常識讓其在臨床高風險應用中存在安全隱患。
研究表明,“集體智能”能通過不同專家獨立判斷的組合提升整體準確性。本研究創(chuàng)新地將人類專家與多個 LLM 視為“同臺評審”,利用各自優(yōu)勢與互補性,構建混合集體智能體系。
Human Diagnosis Project (Human Dx)
標準化處理
加權多數(shù)投票
交叉驗證
將多個 LLM 輸出組合成 AI 集體,在 Top-5 與 Top-3 準確率上均優(yōu)于任何單一 LLM,并在多個專科中保持穩(wěn)定領先。



開放性答案的自動標準化
權重化人機投票機制
跨模態(tài)可遷移性
臨床實地驗證
治療影響評估
偏見與公平性
Prompt 工程優(yōu)化
多模態(tài)融合
決策支持系統(tǒng)化
結論
混合集體智能不是要取代醫(yī)生,而是利用人類的臨床洞察與 AI 的信息整合能力互補,讓醫(yī)療診斷更精準、更安全、更公平。
特別聲明:智慧醫(yī)療網(wǎng)轉載其他網(wǎng)站內(nèi)容,出于傳遞更多信息而非盈利之目的,同時并不代表贊成其觀點或證實其描述,內(nèi)容僅供參考。版權歸原作者所有,若有侵權,請聯(lián)系我們刪除。
凡來源注明智慧醫(yī)療網(wǎng)的內(nèi)容為智慧醫(yī)療網(wǎng)原創(chuàng),轉載需獲授權。
Copyright ? 2022 上海科雷會展服務有限公司 旗下「智慧醫(yī)療網(wǎng)」版權所有 ICP備案號:滬ICP備17004559號-5