智東西(公眾號(hào):zhidxcom)
編 | 季瑜生
導(dǎo)語:利用AI技術(shù),結(jié)合網(wǎng)站歷史評(píng)估、外部渠道評(píng)價(jià)以及文本分析,麻省理工大學(xué)團(tuán)隊(duì)推出了準(zhǔn)確率高達(dá)65%的假新聞檢測(cè)系統(tǒng)。
智東西10月8日消息,近日,麻省理工大學(xué)團(tuán)隊(duì)聯(lián)合塔爾計(jì)算所宣布將利用人工智能進(jìn)行假新聞鑒別,準(zhǔn)確率可達(dá)65%。
“真實(shí)”作為新聞最基本的要素,在當(dāng)下卻變得益發(fā)稀缺。無論是早些年的震驚業(yè)界的珍妮特.庫克事件還是近些年各種網(wǎng)站以及社交媒體上層出不窮的小道消息,人們生活的信息世界里正充斥著大量無法辨別的虛假信息。
三月份的一個(gè)調(diào)查顯示,有一半的美國人都在新聞網(wǎng)站上見到過有偏向性的新聞,而多數(shù)的受訪者則表示無法辨別新聞的真實(shí)性。
那么該如何辨別這些虛假消息呢?麻省理工學(xué)院的研究人員以及塔爾計(jì)算所宣布已經(jīng)創(chuàng)建了一個(gè)可以鑒別信息來源以及可信度、偏見程度的AI系統(tǒng)。該系統(tǒng)將在于比利時(shí)布魯塞爾舉行的2018年EMNLP大會(huì)上公開發(fā)布。
該系統(tǒng)搜集了1,066個(gè)帶有Media Bias / Fact Check的網(wǎng)站開放數(shù)據(jù)集。然后根據(jù)網(wǎng)站本身的文章、維基百科頁面、Twitter帳戶甚至URL等來源,系統(tǒng)對(duì)新聞進(jìn)行了“真實(shí)程度”“偏見程度”的打分。
該系統(tǒng)的創(chuàng)見性在于采用了多維度內(nèi)容評(píng)測(cè),除過文本內(nèi)容提取外新聞來源、網(wǎng)絡(luò)數(shù)據(jù)流量結(jié)構(gòu)、社交媒體評(píng)價(jià)都是重要參考渠道。

▲MIT人工智能系統(tǒng)利用多維度測(cè)評(píng)對(duì)信息真實(shí)性進(jìn)行核查
其中,維基百科是一個(gè)重要參考渠道。一般維基百科里網(wǎng)站的詞條內(nèi)容越長(zhǎng),網(wǎng)站內(nèi)容的真實(shí)性也就越高。此外,維基百科里的標(biāo)簽評(píng)價(jià)也是一大參考要素,洋蔥新聞的維基百科頁面標(biāo)記為偏左,Drudge Report的維基百科頁面標(biāo)記則為保守。
另外,值得一提的是,該系統(tǒng)采用支持向量機(jī)(SVM)來評(píng)估新聞的真實(shí)度與偏見程度。其中,真實(shí)性分為高、中、低三點(diǎn),政治偏向性分為極左、左、中偏左、中偏右、右、極右七點(diǎn)。

▲MIT的研究結(jié)果表明,具有“極端”偏見性和低準(zhǔn)確性的出版物之間存在相關(guān)性。
除過消息來源分析以外,內(nèi)容分析也是一大主要方式,系統(tǒng)會(huì)在每個(gè)新聞網(wǎng)站上分析50到150篇文章,并對(duì)其中的語言進(jìn)行檢查。
一些具有明顯傾向性的新聞網(wǎng)站為了挑起讀者的情緒,相較主流網(wǎng)站,經(jīng)常會(huì)使用一些比較有辨識(shí)度的語言。比如假新聞網(wǎng)站會(huì)經(jīng)常使用一些夸張或者情緒化的詞語,左傾媒體則會(huì)高頻使用“公平”“互惠”。
根據(jù)麻省理工大學(xué)團(tuán)隊(duì)的說法,該系統(tǒng)只需要150篇文章就可以確定是否可以對(duì)新的信源做出評(píng)估。通過這一系統(tǒng),AI在預(yù)測(cè)新聞?wù)鎸?shí)性方面具有大約65%的準(zhǔn)確率,在檢測(cè)偏見程度時(shí)大約有70%的準(zhǔn)確性。
不過,麻省理工大學(xué)并不是唯一使用人工智能來做假新聞分析的。
谷歌的Jigsaw人工智能系統(tǒng)會(huì)自動(dòng)對(duì)讀者的評(píng)論做出評(píng)價(jià)。Facebook則長(zhǎng)期堅(jiān)持利用人工智能技術(shù)來進(jìn)行新聞篩查,近期還收購了總部位于倫敦的創(chuàng)業(yè)公司Bloomsbury AI,以幫助其識(shí)別假新聞。
不過一些專家對(duì)此也表示出了懷疑態(tài)度。
卡內(nèi)基梅隆大學(xué)機(jī)器人研究所(Carnegie Mellon University Robotics Institute)科學(xué)家Dean Pomerleau在接受外媒the Verge的采訪時(shí)表示,人工智能對(duì)于文本中一些比較隱晦的虛假信息以及偏向性內(nèi)容缺乏足夠的理解能力,但是這也正是辨別假新聞的時(shí)候最重要的技能之一。
盡管人們對(duì)于人工智能核查新聞?wù)鎸?shí)性的能力表示懷疑,但是事實(shí)證明人工核查的效果似乎也并不理想。
今年,谷歌其新聞報(bào)道欄下線了“事實(shí)核查”(Fact Check)的標(biāo)簽,因?yàn)榇饲坝斜J嘏擅襟w曾指責(zé)谷歌上經(jīng)過了核查的新聞依舊存在著偏見嫌疑。
更令人灰心的是,根據(jù)Gartner預(yù)測(cè),如果維持當(dāng)前現(xiàn)狀,人工智能也好人工核查也好,都沒辦法跟上假新聞的制造速度。到2022年,發(fā)達(dá)國家的大多數(shù)人會(huì)看到比真實(shí)信息還要多的虛假信息。
文章來源:pop sci 、venture beat