智東西(公眾號(hào):zhidxcom)
編 | 董溫淑

智東西429日消息,近日,麻省理工學(xué)院Auto-ID Labs研究小組研發(fā)了一個(gè)基于語(yǔ)音的新冠肺炎AI檢測(cè)工具——Sigma。Sigma可以“聽(tīng)”出健康人和新冠肺炎患者咳嗽聲的差別,從而區(qū)分出用戶是否感染了COVID-19。

與之前的AI抗疫方案不同的是,研究小組希望用眾包的方式獲取模型訓(xùn)練數(shù)據(jù),并根據(jù)實(shí)時(shí)訓(xùn)練數(shù)據(jù)同步更新模型。

49日,研究小組在學(xué)術(shù)網(wǎng)站arXiv上發(fā)表文章介紹Sigma計(jì)劃,文章名稱為《嗨Sigma,我感染了冠狀病毒嗎?呼吁用新的AI方法來(lái)支持應(yīng)對(duì)新冠病毒大流行的專業(yè)醫(yī)療保健人員(“Hi Sigma,do I have the Coronavirus?”Call for a New Artificial Intelligence Approach to Support Health Care Professionals Dealing With The COVID-19 Pandemi)》。

論文鏈接:https://arxiv.org/pdf/2004.06510.pdf

新冠病毒還能用語(yǔ)音識(shí)別?AI模型“聽(tīng)”咳嗽聲判斷是否感染

目前這項(xiàng)研究還在持續(xù)推進(jìn),研究進(jìn)展在https://opensigma.mit.edu網(wǎng)站更新。

一、語(yǔ)音識(shí)別算法能認(rèn)出肺炎患者咳嗽聲

截至422日,全球新冠肺炎累計(jì)確診人數(shù)已經(jīng)超過(guò)250萬(wàn),死亡人數(shù)超17萬(wàn)。巨大的感染者基數(shù)使醫(yī)療系統(tǒng)不堪重負(fù),疑似病例檢測(cè)同樣需要占用醫(yī)療資源。在這種情況下,已經(jīng)有許多研究機(jī)構(gòu)推出AI解決方案,協(xié)助醫(yī)療人員進(jìn)行COVID-19檢測(cè)或提供預(yù)檢。

但是,麻省理工學(xué)院Auto-ID Labs研究小組指出,現(xiàn)有的研究要么使用靜態(tài)數(shù)據(jù)集、要么在大企業(yè)牽頭下進(jìn)行,都具有一定局限性。靜態(tài)數(shù)據(jù)集難以反映出疫情的發(fā)展變化,大公司牽頭的方案也因隱私風(fēng)險(xiǎn)而飽受質(zhì)疑。

Auto-ID Labs研究小組試圖解決這些問(wèn)題。最終,他們從之前的一項(xiàng)研究中得到了靈感。該研究證明,AI模型可以通過(guò)咳嗽聲錄音,區(qū)分出肺炎患者與正常人,哪怕是來(lái)自廉價(jià)手機(jī)的錄音也不會(huì)影響判斷結(jié)果。

對(duì)新冠病毒感染者咳嗽聲的研究也得出了相同結(jié)論。

新冠病毒還能用語(yǔ)音識(shí)別?AI模型“聽(tīng)”咳嗽聲判斷是否感染

AI模型可識(shí)別出健康人咳嗽聲和感染者咳嗽聲的不同

在針對(duì)神經(jīng)類疾病患者的另一項(xiàng)研究中,語(yǔ)音識(shí)別算法也比人類專家更早判斷出病人發(fā)病情況(樣本量小于50的精神病患者和樣本量小于1000的認(rèn)知障礙患者)。

因此,研究小組提議,可以設(shè)計(jì)一款AI語(yǔ)音識(shí)別工具,并用大規(guī)模收集的實(shí)時(shí)數(shù)據(jù)對(duì)其進(jìn)行訓(xùn)練。

經(jīng)過(guò)幾次嘗試,研究小組打造出了AI語(yǔ)音識(shí)別模型Sigma。

二、模型搭建:基于CNN,學(xué)會(huì)區(qū)分健康人和肺炎患者

Sigma模型基于一個(gè)卷積神經(jīng)網(wǎng)絡(luò)(CNN,convolutional neural network)進(jìn)行訓(xùn)練。

首先,研究人員利用一個(gè)日常談話數(shù)據(jù)庫(kù)對(duì)CNN模型進(jìn)行預(yù)訓(xùn)練;

然后,研究人員用大量相似但不同的數(shù)據(jù)訓(xùn)練模型。這一過(guò)程被稱為遷移學(xué)習(xí),可以提高模型的預(yù)測(cè)能力。

在遷移學(xué)習(xí)的第一階段中,模型需要學(xué)習(xí)分辨咳嗽和不咳嗽的聲紋。研究人員認(rèn)為這一階段最為重要,因此,他們比較了支持向量機(jī)(SVM)、K-近鄰算法(k-Nearest Neighbors algorithm)、隨機(jī)森林(Random Fores)、邏輯回歸(Logistic Regression)這4種淺層機(jī)器學(xué)習(xí)算法的準(zhǔn)確性,試圖找出最佳方案。

結(jié)果顯示,邏輯回歸算法的準(zhǔn)確性最高。

新冠病毒還能用語(yǔ)音識(shí)別?AI模型“聽(tīng)”咳嗽聲判斷是否感染

4種算法準(zhǔn)確性比較

接下來(lái),研究人員利用不到200個(gè)樣本數(shù)據(jù),借助主成分分析方法(Principal Component Analysis)制作出一個(gè)圖表,對(duì)健康人咳嗽和新冠肺炎咳嗽分別進(jìn)行了聚類分析(Cluster analysis),提取兩種咳嗽的特征。

新冠病毒還能用語(yǔ)音識(shí)別?AI模型“聽(tīng)”咳嗽聲判斷是否感染

▲病人不同病程階段咳嗽聲的特征

新冠病毒還能用語(yǔ)音識(shí)別?AI模型“聽(tīng)”咳嗽聲判斷是否感染

COVID-19感染者咳嗽聲的特征

文章中并未給出準(zhǔn)確率數(shù)值,但寫到經(jīng)過(guò)遷移學(xué)習(xí)后,Sigma模型能夠主動(dòng)區(qū)分出這兩類人群。

三、模型發(fā)展:用大規(guī)模實(shí)時(shí)數(shù)據(jù)進(jìn)行遷移學(xué)習(xí)

為了進(jìn)一步提升Sigma模型的準(zhǔn)確性,研究人員計(jì)劃在未來(lái)收集大量真實(shí)數(shù)據(jù),讓模型進(jìn)行深入遷移學(xué)習(xí)。他們強(qiáng)調(diào):如果我們有更多的臨床數(shù)據(jù)和志愿者,我們就可以做更多

他們將從4個(gè)主要渠道獲取信息:招募150名新冠肺炎患者和3000名接觸者,同時(shí)固定收集墨西哥、西班牙和美國(guó)這三個(gè)國(guó)家的感染者咳嗽聲音頻。

此外,研究人員呼吁更多新冠肺炎患者通過(guò)社交媒體渠道提交錄音。文章中寫明了對(duì)錄音的要求

1、錄制內(nèi)容可以是咳嗽聲、數(shù)字從09或語(yǔ)氣詞“Ommmmmmmmm”;

2、錄音時(shí)長(zhǎng)為12秒。

研究人員稱,如果能夠建立一個(gè)足夠大的實(shí)時(shí)數(shù)據(jù)來(lái)源,Sigma模型還能被開(kāi)發(fā)出更多功能:

對(duì)于已經(jīng)確診新冠肺炎、但在居家隔離的患者來(lái)說(shuō),Sigma可以進(jìn)行一項(xiàng)縱向音頻測(cè)試,為用戶提供是否需要醫(yī)院就診的建議;Sigma還可以篩選出病情最嚴(yán)重的新冠肺炎患者,優(yōu)先為他們分配重癥監(jiān)護(hù)病房。

結(jié)語(yǔ):Sigma模型更為精確,期待早日落地

麻省理工學(xué)院Auto-ID Labs研究小組推出的Sigma模型利用大量實(shí)時(shí)數(shù)據(jù)進(jìn)行訓(xùn)練,相比于傳統(tǒng)的AI訓(xùn)練方法更為精確,或能輔助醫(yī)生做出臨床決策。

目前這個(gè)計(jì)劃還在進(jìn)行中,期待它能夠盡快臻于成熟,在抗疫進(jìn)程中發(fā)揮作用。

文章來(lái)源:arXiv