智東西(公眾號(hào):zhidxcom)
編 | 董溫淑

智東西5月11日消息,疫情之下,AI+醫(yī)療按下加速鍵,從線上問(wèn)診、輔助導(dǎo)診、影像篩查到新藥研發(fā),AI均發(fā)揮出重要的輔助作用。然而相比其他應(yīng)用場(chǎng)景,AI在醫(yī)療領(lǐng)域的落地卻面臨更多的困難。

不同醫(yī)療機(jī)構(gòu)的數(shù)據(jù)互不流通、數(shù)據(jù)質(zhì)量參差不齊、搭建AI模型效率低下、輸出結(jié)果不知道怎么解釋……在近期舉辦的國(guó)際學(xué)習(xí)表征會(huì)議(ICLR)上,來(lái)自劍橋大學(xué)、牛津大學(xué)、斯坦福大學(xué)等全球頂尖高校的研究人員們集中探討了這些阻礙AI醫(yī)療落地的關(guān)鍵挑戰(zhàn),并有針對(duì)性地探討了解決這些問(wèn)題的有效方法。

國(guó)際學(xué)習(xí)表征會(huì)議(ICLR 2020)是深度學(xué)習(xí)領(lǐng)域最重要的年度會(huì)議之一,于在4月26日至5月1日以線上方式舉行。

一、AI醫(yī)療落地難!實(shí)際模型效果很一般

當(dāng)今醫(yī)療資源匱乏和分布不平衡的問(wèn)題日益突出,AI的應(yīng)用可以緩解這種局面。比如,遠(yuǎn)程醫(yī)療可以解決偏遠(yuǎn)地區(qū)看病難問(wèn)題,AI讀片工具可以縮短臨床醫(yī)生判斷時(shí)間。但是,要達(dá)到這些目的,前提是AI工具的輸出足夠準(zhǔn)確可靠。

實(shí)際情況中,不同醫(yī)療機(jī)構(gòu)收集、標(biāo)記、注釋、處理醫(yī)療數(shù)據(jù)的方法并不一致,X射線影像、CT影像的質(zhì)量則因?yàn)闄C(jī)器差異而存在較大差異,患者病例或健康記錄中也常缺少信息。這些都導(dǎo)致了能夠用于訓(xùn)練AI模型的有效數(shù)據(jù)資源稀缺,因此,一些AI模型的實(shí)際應(yīng)用效果并不理想。

例如,谷歌的一個(gè)AI模型就在實(shí)際應(yīng)用階段折戟。該AI模型被設(shè)計(jì)用于提升篩查糖尿病性視網(wǎng)膜病變的效率,根據(jù)病人眼球照片快速給出專業(yè)診斷。在實(shí)驗(yàn)室測(cè)試階段,該模型可以把診斷時(shí)間縮減到秒鐘級(jí),準(zhǔn)確率達(dá)到了90%。

但在11個(gè)眼科診所的測(cè)試中,該模型的結(jié)果就沒(méi)有這么理想了。首先,每個(gè)眼科診所的環(huán)境條件不同,有些診所無(wú)法拍攝出高清的眼球照片或網(wǎng)絡(luò)信號(hào)較差,這導(dǎo)致模型上傳圖片的時(shí)間變長(zhǎng)(60到90秒)。另外,一些護(hù)士也擔(dān)憂AI模型的安全性問(wèn)題。這說(shuō)明通過(guò)實(shí)驗(yàn)室檢驗(yàn)并不完全意味著AI工具可以順利落地應(yīng)用。

二、數(shù)據(jù)資源少?讓醫(yī)生臨床經(jīng)驗(yàn)來(lái)幫忙

許多疾病難治療都是因?yàn)橄嚓P(guān)數(shù)據(jù)太少。比如,罕見(jiàn)病的患者記錄就很少,相應(yīng)的醫(yī)學(xué)知識(shí)也很缺乏;對(duì)于心衰等慢性病來(lái)說(shuō),及早治療是關(guān)鍵,但醫(yī)學(xué)界很難提前甄別出有患病風(fēng)險(xiǎn)的患者。

在人工智能平價(jià)醫(yī)療研討會(huì)上,韓國(guó)科學(xué)技術(shù)院(KAIST)助理教授Edward Choi提出,可以利用神經(jīng)網(wǎng)絡(luò)來(lái)解決這些問(wèn)題。一方面,神經(jīng)網(wǎng)絡(luò)可以大面積搜集疾病信息,盡可能多地綜合罕見(jiàn)病相關(guān)信息;另一方面,神經(jīng)網(wǎng)絡(luò)可以回溯病人的電子病例,根據(jù)病人以往的健康狀況判斷出病人是否易患某種慢性疾病。

Choi表示,下一步將繼續(xù)推進(jìn)研究,使神經(jīng)網(wǎng)絡(luò)更好解決數(shù)據(jù)缺乏問(wèn)題。

他計(jì)劃用一種基于圖像的注意力模型(GRAM,graph-based attention model)來(lái)進(jìn)一步解決罕見(jiàn)病數(shù)據(jù)資源少的問(wèn)題。該模型用循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)進(jìn)行訓(xùn)練,是一個(gè)基于醫(yī)學(xué)本體論(medical ontologies)對(duì)疾病進(jìn)行樹(shù)狀分類的工具,可以找出與罕見(jiàn)病相似的常見(jiàn)病。各種疾病的本體理論是由之前的醫(yī)學(xué)家建立起來(lái)的,已經(jīng)通過(guò)實(shí)踐驗(yàn)證。因此,醫(yī)生可以嘗試用常見(jiàn)病的診療方案來(lái)治療罕見(jiàn)病。

對(duì)于病人電子健康記錄數(shù)據(jù)不全的問(wèn)題,Choi提出了圖像卷積Transformer模型(GCT,Graph Convolutional Transformer?)。GCT可以推斷出電子健康記錄缺失的數(shù)據(jù),為臨床醫(yī)生提供更全面的病人信息。

三、數(shù)據(jù)沒(méi)結(jié)構(gòu)化?用AI預(yù)測(cè)哪些出院患者更易再住院

對(duì)康復(fù)患者進(jìn)行預(yù)后診斷可以降低疾病復(fù)發(fā)風(fēng)險(xiǎn),而醫(yī)生需要依靠病人的數(shù)據(jù)做出預(yù)后診斷。但是,不同國(guó)家和地區(qū)、不同醫(yī)療機(jī)構(gòu)收集、處理病人數(shù)據(jù)的方法有差異,醫(yī)護(hù)人員的一時(shí)疏忽則會(huì)導(dǎo)致數(shù)據(jù)無(wú)效。這些原因?qū)е铝酸t(yī)療數(shù)據(jù)非結(jié)構(gòu)化、噪聲數(shù)據(jù)問(wèn)題,進(jìn)而影響了醫(yī)生預(yù)后診斷的準(zhǔn)確性。

谷歌軟件工程師Constanza Fierro團(tuán)隊(duì)認(rèn)為,可以訓(xùn)練一個(gè)AI模型,使其利用高度非結(jié)構(gòu)化數(shù)據(jù)或噪聲數(shù)據(jù)進(jìn)行預(yù)測(cè)。經(jīng)過(guò)嘗試,他們研究出一種深度學(xué)習(xí)架構(gòu),能夠預(yù)測(cè)患者出院后30天內(nèi)再次入院的風(fēng)險(xiǎn)。

研究人員用一個(gè)西班牙語(yǔ)醫(yī)療數(shù)據(jù)集對(duì)該架構(gòu)進(jìn)行了測(cè)試。美國(guó)醫(yī)療機(jī)構(gòu)曾利用該數(shù)據(jù)集進(jìn)行過(guò)相同預(yù)測(cè)。研究人員對(duì)比了模型預(yù)測(cè)結(jié)果和美國(guó)醫(yī)療機(jī)構(gòu)的結(jié)果。對(duì)此顯示,模型預(yù)測(cè)結(jié)果與美國(guó)醫(yī)療機(jī)構(gòu)的結(jié)果基本相符。

但是,F(xiàn)ierro指出,這個(gè)模型的可能不適用于沒(méi)有儲(chǔ)存醫(yī)療數(shù)據(jù)的國(guó)家。

四、建模效率低?讓AI自動(dòng)化學(xué)習(xí)

不同的疾病對(duì)應(yīng)著不同的解決方案,相應(yīng)地,為不同疾病建模需要用到不同的技術(shù)和模型。

劍橋大學(xué)教授、艾倫·圖靈研究所研究員、加州大學(xué)洛杉磯分校校長(zhǎng)教授Mihaela van der Schaar認(rèn)為,為每種疾病各建一個(gè)AI模型效率太低,她主張使用可以大面積推廣的自動(dòng)機(jī)器學(xué)習(xí)(AutoML)方法,讓AI模型自動(dòng)化學(xué)習(xí)合適的參數(shù)和配置。

在實(shí)驗(yàn)對(duì)比幾種AutoML模型后,Mihaela提出一個(gè)針對(duì)臨床預(yù)后量身定制的預(yù)測(cè)建模管道設(shè)計(jì)的自動(dòng)化系統(tǒng)AutoPrognosis。

據(jù)她介紹,AutoPrognosis是“一個(gè)為臨床預(yù)測(cè)量身定制的自動(dòng)涉及預(yù)測(cè)模型管道系統(tǒng)”。AutoPrognosis不會(huì)試圖找到唯一的最佳的預(yù)測(cè)建模管道,而是使用各種管道的“集合”做出預(yù)測(cè)。

盡管這個(gè)模型可以自動(dòng)化對(duì)疾病做出預(yù)測(cè),但是它還有一些局限性,比如缺乏可解釋性。

透明性和可解釋性是AI模型可不可靠的重要參考依據(jù),即能向非專業(yè)人士解釋清楚得到的結(jié)果。尤其是在醫(yī)療領(lǐng)域這樣做任何決定都必須非常嚴(yán)謹(jǐn)?shù)膱?chǎng)景,用AI模型來(lái)診斷疾病更需要可解釋性,也即是能給出令醫(yī)生信服的決策依據(jù)。

五、影像難解釋?把它分區(qū)域量化

如前面所說(shuō),AI模型的可解釋性十分重要。許多研究人員研發(fā)出神經(jīng)網(wǎng)絡(luò)的可解釋性方法,但學(xué)界還未在評(píng)估這些解釋方法上達(dá)成共識(shí)。

這意味著需要一種客觀的度量標(biāo)準(zhǔn),來(lái)告訴研究人員哪種可解釋性方法適合用于其任務(wù)。

針對(duì)這一問(wèn)題,丹麥大學(xué)計(jì)算機(jī)科學(xué)博士Laura Rieger及其團(tuán)隊(duì)提出一種特征迭代移除(IROF,iterative removal of features)的新方法,能以較低的計(jì)算資源和很少的數(shù)據(jù),對(duì)可解釋性方法進(jìn)行客觀的定量評(píng)估。

IROF的評(píng)估指標(biāo)以診斷的準(zhǔn)確性為基礎(chǔ),避開(kāi)了現(xiàn)有評(píng)估方法中相鄰像素之間的高相關(guān)性,并且不依賴可能會(huì)產(chǎn)生偏差的人的視覺(jué)檢查。

在會(huì)議現(xiàn)場(chǎng),Laura用一個(gè)具有可解釋性的神經(jīng)網(wǎng)絡(luò)反證了IROF方法的穩(wěn)健性。

她選用了一個(gè)圖像分類神經(jīng)網(wǎng)絡(luò),輸入一張猴子的圖像,神經(jīng)網(wǎng)絡(luò)快速輸出了正確的分類,即黑白圖像,其中圖像較亮部分對(duì)分類精度的重要性要高于較暗部分。

然后,Laura用計(jì)算機(jī)視覺(jué)算法對(duì)猴子圖像進(jìn)行圖像分割,得到一系列圖像子區(qū)域。

研究人員在識(shí)別出對(duì)分類精度最重要的淺色子區(qū)域后,用“平均值”替換這些淺色子區(qū)域,這樣再次運(yùn)行圖像分類神經(jīng)網(wǎng)絡(luò)的準(zhǔn)確率就會(huì)下降;接著,識(shí)別圖像的第二重要部分,再次應(yīng)用平均值,然后再次運(yùn)行圖像分類神經(jīng)網(wǎng)絡(luò)……隨著替換過(guò)程進(jìn)行,圖像分類神經(jīng)網(wǎng)絡(luò)的準(zhǔn)確性呈現(xiàn)出曲線形下降。曲線上方的面積被稱為IROF得分,可以作為評(píng)估神經(jīng)網(wǎng)絡(luò)可解釋性的一個(gè)定量標(biāo)準(zhǔn)。

AI醫(yī)療數(shù)據(jù)資源少、模型難解釋怎么辦?AI頂會(huì)秀五大破局心法

六、影像質(zhì)量差?用數(shù)據(jù)集模擬偽影和噪聲

CT斷層成像是一種廣泛應(yīng)用的醫(yī)療檢測(cè)手段,可以檢測(cè)出中風(fēng)、骨折等疾病。但是,并非所有的醫(yī)療機(jī)構(gòu)都有能力配備頂尖的CT掃描儀。在醫(yī)療實(shí)踐中,為了控制成本,有些醫(yī)療機(jī)構(gòu)不得不選用低成本的設(shè)備。

低成本CT掃描儀的價(jià)格更經(jīng)濟(jì)、耗電量也較低,但成像中容易出現(xiàn)偽影、噪聲數(shù)據(jù)問(wèn)題,為醫(yī)生增加讀片障礙。

斯坦福大學(xué)電氣工程博士Sarah Hooper及其團(tuán)隊(duì)提出了一個(gè)基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的影像自動(dòng)分類工具,可以自動(dòng)分類有偽影、噪聲數(shù)據(jù)的低質(zhì)量頭部CT影像,幫助醫(yī)療機(jī)構(gòu)控制成本。

低成本CT掃描儀中常出現(xiàn)x射線管電流小、投影數(shù)量少、掃描角度有限等三類問(wèn)題,這些會(huì)導(dǎo)致CT影像質(zhì)量不高。

由于有代表性的低質(zhì)量數(shù)據(jù)有限,研究人員用近一萬(wàn)張頭部CT影像數(shù)據(jù)集,通過(guò)成倍減少電流、投影數(shù)量、改變掃描角度來(lái)模擬那些真實(shí)圖像中的噪聲,借助CatSim仿真軟件創(chuàng)建了龐大的合成數(shù)據(jù)集,然后用這些數(shù)據(jù)來(lái)訓(xùn)練CNN模型。

運(yùn)行結(jié)果顯示,在這三類低質(zhì)量影像中,經(jīng)訓(xùn)練的CNN模型均能克服頭部CT影像分析的硬件限制,準(zhǔn)確分類出異常影像。

AI醫(yī)療數(shù)據(jù)資源少、模型難解釋怎么辦?AI頂會(huì)秀五大破局心法

除了上述模型,其他研究人員還展示了一些其他醫(yī)學(xué)影像相關(guān)研究工作,比如自動(dòng)化頸動(dòng)脈斑塊的3D超聲掃描、從顯微鏡圖像診斷瘧疾、在計(jì)算機(jī)輔助手術(shù)中用AI增強(qiáng)立體攝像機(jī)信息、利用圖像質(zhì)量轉(zhuǎn)移人工增強(qiáng)MRI圖像、改進(jìn)乳腺癌篩查的圖像分類等。

結(jié)語(yǔ):革命雖未成功,曙光就在眼前

無(wú)論把AI技術(shù)應(yīng)用于哪個(gè)領(lǐng)域,研究人員都需要解決技術(shù)、安全性和穩(wěn)健性問(wèn)題。但客觀上來(lái)說(shuō),醫(yī)療保健領(lǐng)域更為特殊。因此,智慧醫(yī)療工具的落地面臨更多困難。

如果能夠攻克技術(shù)和安全性難題,AI技術(shù)或可為醫(yī)療資源匱乏、醫(yī)療資源不平衡等問(wèn)題提供解法,還能提高整體醫(yī)療水平。

正如劍橋大學(xué)教授Mihaela van der Schaar在其演講結(jié)束時(shí)提到的,“我們正處于這場(chǎng)革命的開(kāi)始,還有很長(zhǎng)的路要走。但這是一個(gè)令人興奮的時(shí)刻,是專注于此類技術(shù)的重要時(shí)刻。”隨著AI醫(yī)療類研究持續(xù)推進(jìn),機(jī)器學(xué)習(xí)將為臨床醫(yī)生、醫(yī)學(xué)研究人員和患者帶來(lái)更強(qiáng)大可靠的新工具。

文章來(lái)源:VentureBeat