智東西(公眾號(hào):zhidxcom
作者?|?香草
編輯?|?李水青

智東西7月24日?qǐng)?bào)道,今日,中國(guó)人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟(AIIA)安全治理委員會(huì)舉辦了成果發(fā)布會(huì)。會(huì)上,中國(guó)信息通信研究院人工智能研究所安全與元宇宙部主任石霖,解讀了成立半年來(lái)委員會(huì)形成的組織架構(gòu),安全、治理兩大工作組的工作情況,并啟動(dòng)了AI安全守護(hù)計(jì)劃,發(fā)布了三大類(lèi)別的安全評(píng)測(cè)結(jié)果。

AIIA安全治理委員會(huì)成立于2023年12月底,經(jīng)過(guò)半年運(yùn)營(yíng),現(xiàn)有治理組、安全組兩個(gè)工作組,近百家單位加入,主任單位由中國(guó)信通院牽頭,副主任單位包括多家知名企業(yè)和高校。

其中,治理組工作圍繞AI治理框架、合規(guī)治理、賦能治理展開(kāi),安全組主要開(kāi)展大模型安全、合規(guī)等研究及基準(zhǔn)測(cè)試。

今年6月,中國(guó)信通院依托該委員會(huì)發(fā)起“人工智能安全守護(hù)計(jì)劃”,包括建立威脅信息共享機(jī)制、開(kāi)展AIGC真實(shí)內(nèi)容來(lái)源可信工作、建立AI保險(xiǎn)機(jī)制等。

一、成立半年近百家單位加入,形成安全、治理兩大工作組

AIIA安全治理委員會(huì)成立于2023年12月底,經(jīng)過(guò)半年的運(yùn)營(yíng),組織架構(gòu)現(xiàn)有治理組、安全組兩個(gè)工作組,同時(shí)負(fù)責(zé)運(yùn)營(yíng)安全對(duì)齊伙伴計(jì)劃、可信人臉應(yīng)用守護(hù)計(jì)劃、內(nèi)容科技產(chǎn)業(yè)推進(jìn)方陣等。

AI安全守護(hù)計(jì)劃啟動(dòng)!信通院牽頭,AIIA安全治理委員會(huì)發(fā)布三類(lèi)模型安全評(píng)測(cè)

▲AIIA安全治理委員會(huì)整體情況

目前,AIIA安全治理委員會(huì)已有近百家單位加入,由主任單位、副主任單位、專(zhuān)家委和辦公室,以及圍繞業(yè)務(wù)方向設(shè)置的工作組和伙伴計(jì)劃組成。

其中,主任單位由中國(guó)信通院牽頭,副主任單位包括vivo、百度、騰訊、360、華為、中國(guó)移動(dòng)、阿里、浙江大學(xué)以及螞蟻集團(tuán)。

專(zhuān)家委負(fù)責(zé)對(duì)AIIA安全治理委員會(huì)的總體工作進(jìn)行把關(guān),兩個(gè)工作組及伙伴計(jì)劃則負(fù)責(zé)開(kāi)展AI相關(guān)研究,推動(dòng)產(chǎn)業(yè)鏈各方的AI安全治理工作。

據(jù)石霖介紹,治理組目前的工作進(jìn)展圍繞三個(gè)方面展開(kāi),包括AI治理框架、AI合規(guī)治理以及AI賦能治理。

AI安全守護(hù)計(jì)劃啟動(dòng)!信通院牽頭,AIIA安全治理委員會(huì)發(fā)布三類(lèi)模型安全評(píng)測(cè)

▲治理組工作進(jìn)展

具體來(lái)說(shuō),治理工作組聚焦AI整體治理框架研究和起草工作,與國(guó)際對(duì)標(biāo),如針對(duì)ISO/IEC 42001等進(jìn)行研討對(duì)比,輸入國(guó)際優(yōu)秀風(fēng)險(xiǎn)管理經(jīng)驗(yàn)。

同時(shí),治理組圍繞人臉識(shí)別等典型應(yīng)用開(kāi)展工作,支撐地方網(wǎng)信主管部門(mén)針對(duì)文旅行業(yè)開(kāi)展合規(guī)實(shí)踐,形成人臉識(shí)別相關(guān)治理研究報(bào)告。

此外,圍繞AI賦能治理,治理組開(kāi)展法律大模型相關(guān)技術(shù)標(biāo)準(zhǔn)規(guī)范研討工作,相關(guān)規(guī)范正式定稿。

安全組則主要根據(jù)大模型安全、合規(guī)等熱點(diǎn)方向,開(kāi)展安全基準(zhǔn)測(cè)試,推動(dòng)多項(xiàng)AI原生安全規(guī)范的編寫(xiě)和技術(shù)交流。

AI安全守護(hù)計(jì)劃啟動(dòng)!信通院牽頭,AIIA安全治理委員會(huì)發(fā)布三類(lèi)模型安全評(píng)測(cè)

▲安全組工作進(jìn)展

目前,安全組圍繞大模型的安全合規(guī)和技術(shù)研究開(kāi)展文檔編寫(xiě)等,已經(jīng)開(kāi)展了兩個(gè)批次的AI安全Benchmark測(cè)試工作,其中二季度融入了更多常見(jiàn)攻擊方法,包括誘導(dǎo)攻擊、提示詞注入攻擊、內(nèi)容泛化攻擊等,能更全面直觀反映國(guó)內(nèi)外閉源模型的安全情況。

圍繞AI原生安全、AI賦能安全等,安全組在今年上半年先后召開(kāi)了線上/線下共20多場(chǎng)交流研討,開(kāi)展了標(biāo)準(zhǔn)制定、測(cè)試評(píng)估等工作,包括大模型安全、AI網(wǎng)絡(luò)安全大模型規(guī)范、AIGC檢測(cè)規(guī)范等。

二、啟動(dòng)AI安全守護(hù)計(jì)劃,三大安全測(cè)評(píng)結(jié)果發(fā)布

石霖談道,在兩大工作組的實(shí)踐當(dāng)中委員會(huì)發(fā)現(xiàn),單獨(dú)的工作組各自圍繞安全或治理,從規(guī)則或技術(shù)角度開(kāi)展工作,在這個(gè)過(guò)程中技術(shù)和規(guī)則需要融合。因此,建立跨組安全防護(hù)能力至關(guān)重要。

今年6月,中國(guó)信通院依托AIIA發(fā)起“人工智能安全守護(hù)計(jì)劃”,即AI Guard,目標(biāo)是聯(lián)合多方力量提升我國(guó)AI技術(shù)水平和治理能力,促進(jìn)產(chǎn)業(yè)健康有序發(fā)展。

AI安全守護(hù)計(jì)劃啟動(dòng)!信通院牽頭,AIIA安全治理委員會(huì)發(fā)布三類(lèi)模型安全評(píng)測(cè)

▲人工智能安全守護(hù)計(jì)劃

首先,該計(jì)劃將建立AI威脅信息共享機(jī)制,從AI芯片等基礎(chǔ)設(shè)施,到數(shù)據(jù)、算法、應(yīng)用等方面的漏洞,通過(guò)委員會(huì)層面的互助共治及時(shí)預(yù)警,提升安全防范能力,從而應(yīng)對(duì)AI安全威脅除等問(wèn)題。

其次,該計(jì)劃將開(kāi)展AIGC真實(shí)內(nèi)容來(lái)源可信工作,通過(guò)建立統(tǒng)一內(nèi)容標(biāo)準(zhǔn)平臺(tái),打造內(nèi)容可溯源的能力。目前主要針對(duì)圖片、音頻和視頻等多模態(tài)內(nèi)容,采用隱式水印方法建立互認(rèn)機(jī)制。文本內(nèi)容上的實(shí)現(xiàn)仍有一定技術(shù)難度,后續(xù)將持續(xù)有針對(duì)性地突破。

此外,計(jì)劃將通過(guò)AI保險(xiǎn)機(jī)制,為相關(guān)人員和單位給予救濟(jì),提供賠償兜底策略。

最后,石霖發(fā)布了大模型安全風(fēng)險(xiǎn)防范能力評(píng)測(cè)、多模態(tài)圖文大模型內(nèi)容安全防范能力評(píng)測(cè)、人臉識(shí)別安全專(zhuān)項(xiàng)評(píng)測(cè)以及代碼大模型安全風(fēng)險(xiǎn)風(fēng)險(xiǎn)防范能力評(píng)測(cè)結(jié)果,vivo、螞蟻、阿里云、百度、科大訊飛、商湯等作為代表獲得了證書(shū)。

AI安全守護(hù)計(jì)劃啟動(dòng)!信通院牽頭,AIIA安全治理委員會(huì)發(fā)布三類(lèi)模型安全評(píng)測(cè)

▲大模型安全風(fēng)險(xiǎn)防范能力評(píng)測(cè)、多模態(tài)圖文大模型內(nèi)容安全防范能力評(píng)測(cè)結(jié)果

AI安全守護(hù)計(jì)劃啟動(dòng)!信通院牽頭,AIIA安全治理委員會(huì)發(fā)布三類(lèi)模型安全評(píng)測(cè)

▲人臉識(shí)別安全專(zhuān)項(xiàng)評(píng)測(cè)結(jié)果

AI安全守護(hù)計(jì)劃啟動(dòng)!信通院牽頭,AIIA安全治理委員會(huì)發(fā)布三類(lèi)模型安全評(píng)測(cè)

▲代碼大模型安全風(fēng)險(xiǎn)風(fēng)險(xiǎn)防范能力評(píng)測(cè)結(jié)果

結(jié)語(yǔ):推動(dòng)AI向安全可靠可控方向發(fā)展

大模型發(fā)展迅速,但AI安全問(wèn)題的嚴(yán)重性和緊迫性不容忽視,安全挑戰(zhàn)已從技術(shù)本身的傳統(tǒng)安全問(wèn)題向多方面擴(kuò)展,各國(guó)和地區(qū)基本形成本土框架。例如,美國(guó)推出風(fēng)險(xiǎn)管理框架,歐盟構(gòu)建風(fēng)險(xiǎn)分級(jí)治理方案,新加坡推出治理模型框架并提出9個(gè)維度,日本發(fā)布指南制定行為準(zhǔn)則等。

而在國(guó)內(nèi),AIIA安全治理委員會(huì)正在積極推動(dòng)精準(zhǔn)化治理前沿技術(shù)治理工具的構(gòu)建,目前已圍繞治理框架、風(fēng)險(xiǎn)管理、衛(wèi)生安全、安全應(yīng)用取得一定成果。未來(lái)在各單位的共同努力下,期待我國(guó)能形成完整的安全風(fēng)險(xiǎn)機(jī)制,確保AI向安全可靠可控方向發(fā)展。