日前,Google Research 和 Google DeepMind 的 AI 團(tuán)隊(duì)開(kāi)發(fā)了一款基于大語(yǔ)言模型的人工智能系統(tǒng), AMIE(Articulate Medical Intelligence Explorer),針對(duì)診斷對(duì)話進(jìn)行了優(yōu)化。AMIE采用了一種強(qiáng)化學(xué)習(xí)算法中的「自我博弈」方法,可以在一個(gè)模擬環(huán)境中自我對(duì)弈,通過(guò)自動(dòng)反饋機(jī)制,可在各種疾病、醫(yī)學(xué)專(zhuān)科和環(huán)境中進(jìn)行擴(kuò)展學(xué)習(xí)。AMIE已通過(guò)圖靈測(cè)試。該研究于 2024 年 1 月 11 日發(fā)布在 arXiv 預(yù)印平臺(tái)。
研究人員基于真實(shí)世界數(shù)據(jù)集訓(xùn)練AMIE,這些數(shù)據(jù)集包括醫(yī)學(xué)推理、醫(yī)學(xué)總結(jié)和真實(shí)世界的臨床對(duì)話。但同時(shí)也面臨著挑戰(zhàn),一方面,現(xiàn)有的真實(shí)世界數(shù)據(jù)往往無(wú)法捕捉到大量的醫(yī)療條件和場(chǎng)景,這阻礙了數(shù)據(jù)的可擴(kuò)展性和全面性。另一方面,從真實(shí)世界對(duì)話記錄中獲得的數(shù)據(jù)往往是嘈雜的,包含含糊不清的語(yǔ)言(包括俚語(yǔ)、行話、幽默和諷刺)、中斷、不合語(yǔ)法的語(yǔ)句和不明確的引用。
為了解決這些局限性,研究人員設(shè)計(jì)了一個(gè)基于自演的模擬學(xué)習(xí)環(huán)境,讓聊天機(jī)器人訓(xùn)練自己“對(duì)話”。該環(huán)境具有自動(dòng)反饋機(jī)制,用于模擬醫(yī)療環(huán)境中的診斷性醫(yī)療對(duì)話,從而在多種醫(yī)療條件和環(huán)境中擴(kuò)展AMIE的知識(shí)和能力。
研究人員利用現(xiàn)有的現(xiàn)實(shí)世界數(shù)據(jù)集(例如電子健康記錄和轉(zhuǎn)錄的醫(yī)療對(duì)話)對(duì)基礎(chǔ) LLM 進(jìn)行了微調(diào)。為了進(jìn)一步訓(xùn)練模型,研究人員要求 LLM 扮演患有特定病癥的人,以及富有同理心的臨床醫(yī)生,旨在了解患者的病史并設(shè)計(jì)潛在的診斷。
團(tuán)隊(duì)設(shè)計(jì)了一個(gè)框架,來(lái)評(píng)估診斷對(duì)話的過(guò)程,包括病史采集、診斷準(zhǔn)確性、管理推理、溝通技巧和同理心。通過(guò)一項(xiàng)隨機(jī)、雙盲交叉研究,以客觀結(jié)構(gòu)化臨床檢查(OSCE)的方式與經(jīng)過(guò)驗(yàn)證的患者參與者進(jìn)行基于文本的咨詢,將 AMIE 的表現(xiàn)與初級(jí)保健醫(yī)生(PCP)的表現(xiàn)進(jìn)行了比較。
該研究包括來(lái)自加拿大、英國(guó)和印度臨床提供者的 149 個(gè)病例場(chǎng)景、20 個(gè)與 AMIE 進(jìn)行比較的初級(jí)保健醫(yī)生(PCP),以及專(zhuān)科醫(yī)生和患者參與者的評(píng)估。研究人員觀察到AMIE在模擬診斷對(duì)話中的表現(xiàn)至少與初級(jí)保健醫(yī)生不相上下。根據(jù)專(zhuān)科醫(yī)生的說(shuō)法,AMIE的診斷準(zhǔn)確性更高,在32個(gè)指標(biāo)中的28?jìng)€(gè)指標(biāo)上表現(xiàn)更優(yōu)。根據(jù)參與研究的患者的說(shuō)法,AMIE在26個(gè)指標(biāo)中的24個(gè)指標(biāo)上表現(xiàn)更優(yōu),包括禮貌、解釋病情和治療、給人誠(chéng)實(shí)的印象以及表達(dá)關(guān)心和承諾等。
AMIE表現(xiàn)出了充分的潛力,但目前該工具仍處于純粹的實(shí)驗(yàn)階段,還沒(méi)有在真正的患者身上進(jìn)行過(guò)測(cè)試。該團(tuán)隊(duì)在論文里也注明了該工具的局限性,應(yīng)謹(jǐn)慎使用。
論文的合著者 Alan Karthikesalingam 表示,下一步是進(jìn)行更詳細(xì)的研究,從而評(píng)估潛在的偏見(jiàn),并確保該系統(tǒng)對(duì)不同人群是公平的。Google 團(tuán)隊(duì)也在研究對(duì)臨床醫(yī)療問(wèn)題系統(tǒng)測(cè)試的道德要求。未來(lái)還有許多重要的限制因素需要解決,包括在真實(shí)世界限制條件下的實(shí)驗(yàn)表現(xiàn),以及對(duì)健康公平與公正、隱私、穩(wěn)健性等重要主題的專(zhuān)門(mén)探索,以確保技術(shù)的安全性和可靠性。
注:文章來(lái)源于大健康派,如有侵權(quán),請(qǐng)聯(lián)系刪除