9月8日上午,在上海舉行的2023 inclusion·外灘大會《從機(jī)器智能到人機(jī)智能》論壇上,ATEC前沿科技探索社區(qū)宣布啟動ATEC“數(shù)星”計劃。
這是業(yè)內(nèi)首個基于真實工業(yè)場景的大規(guī)模研究性數(shù)據(jù)集開放計劃,首批將公開兩個脫敏的、超大規(guī)模的工業(yè)數(shù)據(jù)集——ATEC2022賽事數(shù)據(jù)集“農(nóng)村金融風(fēng)險預(yù)測”和螞蟻集團(tuán)多場景多模態(tài)點擊率預(yù)估數(shù)據(jù)集(AntM2C)。
“農(nóng)村金融風(fēng)險預(yù)測”中包含了涉農(nóng)經(jīng)營者的信貸風(fēng)險信息及用戶的歷史多源交互數(shù)據(jù)。如何利用數(shù)字化技術(shù)識別農(nóng)村經(jīng)營者的經(jīng)營狀況和經(jīng)營風(fēng)險,是幫助農(nóng)村經(jīng)營者進(jìn)行融資的基礎(chǔ)能力之一。該數(shù)據(jù)集在遵循國家法律法規(guī)及個人隱私保護(hù)的前提下,為金融科技領(lǐng)域、特別是農(nóng)村金融科技領(lǐng)域的行業(yè)研究和發(fā)展提供了重要的數(shù)據(jù)支持。
AntM2C覆蓋支付寶內(nèi)多個業(yè)務(wù)場景,包含廣告、營銷、搜索和推薦真實場景中不同類型商品的CTR數(shù)據(jù),整體數(shù)據(jù)規(guī)模達(dá)到10億(第一階段發(fā)布1700萬規(guī)模的數(shù)據(jù))。該數(shù)據(jù)集的發(fā)布填補了行業(yè)內(nèi),多場景多模態(tài)點擊率預(yù)估問題的數(shù)據(jù)集空白。
清華大學(xué)計算機(jī)系副系主任、ATEC前沿科技探索社區(qū)發(fā)起人徐恪教授指出,“數(shù)星”計劃是ATEC社區(qū)在科技賽事、高校實訓(xùn)之后的又一項重要舉措。數(shù)字技術(shù)的研究和發(fā)展離不開真實應(yīng)用的數(shù)據(jù)土壤,億級規(guī)模工業(yè)數(shù)據(jù)集,將成為人機(jī)智能等創(chuàng)新技術(shù)的關(guān)鍵燃料,推動機(jī)器智能等新一代數(shù)字技術(shù)的新范式發(fā)展。”
目前,“數(shù)星”計劃的數(shù)據(jù)集可在ATEC官方平臺下載。
ATEC 是信息領(lǐng)域前沿技術(shù)實踐發(fā)展社區(qū),致力于搭建面向新一代互聯(lián)網(wǎng)相關(guān)技術(shù)的產(chǎn)學(xué)研合作平臺,推動創(chuàng)新技術(shù)的產(chǎn)業(yè)應(yīng)用研究,支持實踐型技術(shù)人才培養(yǎng),傳播積極奮進(jìn)的工程師文化。社區(qū)的發(fā)起單位包括清華大學(xué)、上海交通大學(xué)、浙江大學(xué)、西安交通大學(xué)和螞蟻集團(tuán)等。
人機(jī)混合智能是人工智能發(fā)展的必經(jīng)之路,本次論壇圍繞以人為本的人機(jī)增強(qiáng)Al技術(shù)的關(guān)鍵技術(shù)發(fā)展和價值,以及產(chǎn)業(yè)應(yīng)用和實踐等進(jìn)行了探討。同濟(jì)大學(xué)校長鄭慶華,清華大學(xué)計算機(jī)系教授、信息科學(xué)與技術(shù)國家研究中心副主任朱文武,浙江大學(xué)教授吳飛,螞蟻集團(tuán)資深算法專家俞吳杰做了主題演講。