智東西(公眾號(hào):zhidxcom)
編譯 | 屈望苗
編輯 | 江心白

智東西5月8日消息,在上周舉行的美國(guó)填字游戲錦標(biāo)賽(American Crossword Puzzle Tournament,ACPT)上,一位人工智能選手從1000多名參賽者中脫穎而出,獲得勝利,它就是填字游戲程序“菲爾博士(Dr. Fill)”。

盡管在兩道題上出現(xiàn)了錯(cuò)誤,但Dr. Fill仍在一分鐘內(nèi)完成了游戲,比最快的人類參賽者快了整整兩分鐘。Dr. Fill的背后有著加州大學(xué)伯克利分校(UC Berkeley)伯克利自然語(yǔ)言處理小組的強(qiáng)大支持,它會(huì)分析題目線索生成答案列表,并根據(jù)數(shù)據(jù)庫(kù)中的800多萬(wàn)組線索和答案來解謎。

一、神經(jīng)網(wǎng)絡(luò)與數(shù)據(jù)庫(kù)加持

Dr. Fill是由計(jì)算機(jī)科學(xué)家馬特·金斯伯格(Matt Ginsberg)制作的,他同時(shí)也是一名填字游戲制作者。

自2012年以來,金斯伯格就開始讓Dr. Fill非正式地參加ACPT,并在每年的比賽中對(duì)它的軟件進(jìn)行改進(jìn)。

AI贏得填字游戲冠軍!打敗1000多名人類選手

▲馬特·金斯伯格(Matt Ginsberg)和Dr. Fill

而在今年,金斯伯格與加州大學(xué)伯克利分校(UC Berkeley)的伯克利自然語(yǔ)言處理小組合作,該小組由教授丹·克萊恩(Dan Klein)領(lǐng)導(dǎo)的研究生和本科生組成。

克萊恩是自然語(yǔ)言處理和無(wú)監(jiān)督學(xué)習(xí)領(lǐng)域的專家,他曾獲得2016 AMiner自然語(yǔ)言處理領(lǐng)域十大最具影響力學(xué)者獎(jiǎng)。AMiner是由清華大學(xué)創(chuàng)立的新一代智能型科技情報(bào)平臺(tái)。

AI贏得填字游戲冠軍!打敗1000多名人類選手

▲丹·克萊恩(Dan Klein)

就在ACPT開始前兩周,他們共同為Dr. Fill開發(fā)了一個(gè)混合系統(tǒng)。其中,伯克利小組用神經(jīng)網(wǎng)絡(luò)的方法來幫助Dr. Fill分析線索,而金斯伯格編寫了用來填寫游戲網(wǎng)格的代碼。

Dr. Fill還有一個(gè)包含800多萬(wàn)條線索和答案的訓(xùn)練數(shù)據(jù)庫(kù),這些數(shù)據(jù)來自以往在各種媒體上出現(xiàn)過的填字游戲。為了解決謎題,它的程序會(huì)參考以往的線索和答案。

和人類一樣,當(dāng)面對(duì)新的挑戰(zhàn)時(shí),Dr. Fill必須依靠經(jīng)驗(yàn),尋找新舊問題之間的聯(lián)系。

例如,ACPT 2021中第二題的答案,就是一個(gè)長(zhǎng)單詞后加上后綴-ITY構(gòu)成的新詞。不過幸運(yùn)的是,類似的題目曾出現(xiàn)在2010年《洛杉磯時(shí)報(bào)(the Los Angeles Times)》發(fā)表的一個(gè)填字游戲中,Dr. Fill的數(shù)據(jù)庫(kù)當(dāng)中包含了這道題,所以它順利地解出了答案。

二、會(huì)分析題目線索,還能篩選答案

盡管Dr. Fill的數(shù)據(jù)庫(kù)十分龐大,但它并不能靠“抄作業(yè)”拿第一。

在實(shí)際的解題過程中,Dr. Fill會(huì)分析題目線索,并生成與題目線索匹配的候選答案列表,根據(jù)可能性對(duì)它們進(jìn)行排序,并檢查它們是否能填字游戲網(wǎng)格中和其他單詞恰當(dāng)連接。只要題目給出了足夠的上下文語(yǔ)境,Dr. Fill就能最終解出正確答案。

例如,對(duì)于“imposing groups”這個(gè)線索,Dr. Fill將正確的答案“ARRAYS”列為首選詞。“imposing”一詞從未出現(xiàn)在與正確答案相關(guān)的線索中,但這些線索中出現(xiàn)過其他同義詞,如“impressive”,這使Dr. Fill可以推斷出語(yǔ)義上的聯(lián)系,并解出正確答案。

AI贏得填字游戲冠軍!打敗1000多名人類選手

▲Dr. Fill從題目線索直接推斷出正確答案

Dr. Fill還會(huì)將字母進(jìn)行交叉比對(duì)來篩選正確答案。比如,在五個(gè)字母的答案中,知道第二個(gè)字母是O,答案的線索是“Aw, that’s a shame?。ㄌ上Я耍。?,它就可以找到正確的答案“SO SAD”。

AI贏得填字游戲冠軍!打敗1000多名人類選手

▲Dr. Fill將字母進(jìn)行交叉比對(duì)來篩選答案

題目中涉及雙關(guān)語(yǔ)或其他文字游戲的線索會(huì)比較麻煩,不過,伯克利的神經(jīng)網(wǎng)絡(luò)系統(tǒng)使Dr. Fill能夠識(shí)別出這類線索??巳R恩解釋說,雖然這些語(yǔ)義上的把戲無(wú)法明確地教給Dr. Fill,但通過機(jī)器學(xué)習(xí),它能明白要尋找沒有常規(guī)線索那么直接的選項(xiàng)。

三、人腦仍勝在跳躍性邏輯

《紐約時(shí)報(bào)》的填字游戲編輯威爾·肖茨(Will Shortz)指出,今年的ACPT可能發(fā)揮了Dr. Fill的優(yōu)勢(shì),因?yàn)椤懊恳粋€(gè)答案都是語(yǔ)義簡(jiǎn)單,很好理解的”。肖茨說,他對(duì)Dr. Fill的獨(dú)創(chuàng)性感到敬畏,但他認(rèn)為人類參賽者在很多方面仍有優(yōu)勢(shì)。

他說:“現(xiàn)在,仍然是人類更擅長(zhǎng)像填字游戲這樣非邏輯的現(xiàn)實(shí)世界問題?!痹谒磥?,即使是在比較簡(jiǎn)單的題目中,Dr. Fill仍然會(huì)犯一些人類不會(huì)犯的錯(cuò)誤。

克萊恩也看到了這一點(diǎn),同時(shí)他也提到,在自然語(yǔ)言處理領(lǐng)域經(jīng)常會(huì)出現(xiàn)類似的挑戰(zhàn)。例如,人類的大腦經(jīng)常進(jìn)行所謂的“多跳推理”,就是說,人腦會(huì)利用很多不直接相關(guān)的知識(shí)完成一個(gè)跳躍性的推理。

而要教會(huì)人工智能遵循這樣的邏輯跳躍,就意味著人們要從很多間接表意的語(yǔ)言中提取并歸納出表達(dá)的邏輯。但在當(dāng)下,Dr. Fill仍然難以理解這些不是“大白話”的語(yǔ)言。

克萊恩認(rèn)為,Dr. Fill這次的表現(xiàn)只是我們從填字游戲的線索中解讀自然語(yǔ)言意義的第一步。當(dāng)涉及到表意特別委婉的語(yǔ)言樣本時(shí),克萊恩說:“那些難倒人們的語(yǔ)言更會(huì)難倒Dr. Fill?!?/p>

結(jié)語(yǔ):AI自然語(yǔ)言處理進(jìn)階,從輸出到“思考”

Dr. Fill在APCT中的勝利標(biāo)志了人工智能在自然語(yǔ)言處理方面的進(jìn)步。也就是說,人工智能已經(jīng)不僅可以實(shí)現(xiàn)簡(jiǎn)單的自然語(yǔ)言交流,而且還能“理解”比較復(fù)雜的語(yǔ)義、“思考”如何解謎。

在未來,隨著科學(xué)家們對(duì)自然語(yǔ)言的意義拆解更加深入和系統(tǒng)化,這些人工智能的“思考”能力或許還會(huì)更接近人腦、更加強(qiáng)大。

來源:Wired