智東西(公眾號:zhidxcom)
作者 | 程茜
編輯 | 李水青

智東西11月26日消息,11月24日,字節(jié)跳動技術(shù)副總裁楊震原在2025字節(jié)跳動獎(jiǎng)學(xué)金頒獎(jiǎng)典禮上發(fā)表演講,他透露2026年P(guān)ICO將有新品發(fā)布。

為提升MR技術(shù)中虛擬物體和現(xiàn)實(shí)世界的融合度,PICO為MR設(shè)備全鏈路自研了專用消費(fèi)級芯片,2022年6月立項(xiàng)、2024年回片,目前已進(jìn)入量產(chǎn),實(shí)測顯示,芯片系統(tǒng)延遲在12毫秒左右。

字節(jié)跳動VP復(fù)盤12年發(fā)展!劇透明年P(guān)ICO新品、全自研MR芯片

▲字節(jié)跳動副總裁楊震原

楊震原于2014年加入字節(jié)跳動,從最初幫助字節(jié)跳動創(chuàng)始人張一鳴搭建新的推薦算法至今已接近12年。他在演講中回顧了字節(jié)跳動幾個(gè)重要的技術(shù)發(fā)展節(jié)點(diǎn):

2014年,他們用大規(guī)模機(jī)器學(xué)習(xí)系統(tǒng)來搭建推薦系統(tǒng),在僅有5個(gè)人的情況下,只能選兩個(gè)人各自負(fù)責(zé)一套優(yōu)化器方案;

2020年字節(jié)開始探索科學(xué)計(jì)算產(chǎn)生的有價(jià)值數(shù)據(jù);

2021年收購PICO,2023年因硬件體驗(yàn)不成熟,內(nèi)部決定減少內(nèi)容和營銷投入,堅(jiān)定技術(shù)投入。從技術(shù)成果來看,PICO最終成品目前平均PPD(每度像素?cái)?shù))達(dá)到40,中心區(qū)域超過45,屬于行業(yè)領(lǐng)先水平;通過MicroOLED定制提升XR設(shè)備清晰度;字節(jié)全鏈路自研的MR頭顯專用消費(fèi)級芯片目前進(jìn)入量產(chǎn)。

最后是大模型方面,2021年字節(jié)內(nèi)部就有員工訓(xùn)練了大語言模型,但當(dāng)時(shí)他們得到的結(jié)論是,大模型目前沒什么用。楊震原說,這也說明當(dāng)時(shí)他們很沒眼光。

這也對應(yīng)了此前PICO被曝產(chǎn)品計(jì)劃更改、裁員以及計(jì)劃研發(fā)MR設(shè)備的消息。

2023年12月,據(jù)外媒The Information報(bào)道,PICO計(jì)劃取消原有PICO 5的研發(fā)計(jì)劃,轉(zhuǎn)而研發(fā)高端MR頭顯,對標(biāo)蘋果Vision Pro。同一時(shí)期,PICO還被曝開啟裁員、調(diào)崗,從2023年年初的1800余人團(tuán)隊(duì),縮減至800余人。

今年7月,PICO被曝正在研發(fā)一款MR設(shè)備,計(jì)劃將數(shù)字內(nèi)容疊加在現(xiàn)實(shí)世界視野中,直接對標(biāo)Meta即將推出的輕量級MR設(shè)備。

以下是演講全文的關(guān)鍵內(nèi)容總結(jié):

2014年,張一鳴想用大規(guī)模機(jī)器學(xué)習(xí)系統(tǒng)來搭建推薦系統(tǒng),解決各種媒體形式,包括圖片、文字、視頻的推薦,他們計(jì)劃2014年做到萬億級別的特征規(guī)模

楊震原提到這背后在優(yōu)化算法方面的挑戰(zhàn),LR的優(yōu)化是成熟技術(shù),但不同的方法效率、效果差異巨大。字節(jié)內(nèi)部當(dāng)時(shí)僅5個(gè)人,只能選兩個(gè)人同步負(fù)責(zé)兩套優(yōu)化器方案,同步進(jìn)行調(diào)研。

字節(jié)跳動VP復(fù)盤12年發(fā)展!劇透明年P(guān)ICO新品、全自研MR芯片

2014年底,字節(jié)逐漸引入FM類算法,后來演化成更通用的深度學(xué)習(xí)體系。如今,其已發(fā)現(xiàn)面向模型訓(xùn)練環(huán)節(jié)的流式更新、較淺層的神經(jīng)網(wǎng)絡(luò)算法在推薦中依然有不錯(cuò)的效果。

2020年,他們意識到科學(xué)計(jì)算能產(chǎn)生很多有價(jià)值數(shù)據(jù)。

字節(jié)跳動在第一性原理計(jì)算、分子動力學(xué)上進(jìn)行了探索。今年,字節(jié)和比亞迪成立了聯(lián)合實(shí)驗(yàn)室,會將高通量自動化實(shí)驗(yàn)與科學(xué)計(jì)算算法結(jié)合,探索AI for Science在電池材料領(lǐng)域的工業(yè)落地應(yīng)用。目前,GPU加速DFT計(jì)算、力場+分子動力學(xué)模擬、預(yù)測+設(shè)計(jì)模型均已投入字節(jié)企業(yè)合作伙伴進(jìn)行實(shí)際應(yīng)用。

字節(jié)跳動VP復(fù)盤12年發(fā)展!劇透明年P(guān)ICO新品、全自研MR芯片

2021年,字節(jié)收購了PICO團(tuán)隊(duì),開始同步推進(jìn)兩個(gè)產(chǎn)品路線,一是以當(dāng)前的產(chǎn)品形態(tài)為主,同時(shí)投入資源運(yùn)營視頻、直播等內(nèi)容,較為激進(jìn)的營銷;二是投資基礎(chǔ)技術(shù),追求核心體驗(yàn)上一個(gè)大臺階。

楊震原透露,2023年,其內(nèi)部決定減少內(nèi)容和營銷投入,更堅(jiān)定的投入技術(shù)路線。這是因?yàn)楫?dāng)時(shí)產(chǎn)品的硬件體驗(yàn)尚未成熟,無法支撐大規(guī)模市場應(yīng)用。

楊震原列舉了目前PICO探索的幾條技術(shù)路線,包括XR設(shè)備清晰度、MR、交互。

清晰度方面,他們最終的成品平均PPD(每度像素?cái)?shù))達(dá)到40,中心區(qū)域超過45。楊震原說,這應(yīng)該屬于行業(yè)領(lǐng)先水平。PPD指人眼睛看一個(gè)度大概有多少像素,PPD大于30大概可以看文字,40會比較清晰,到60的視覺體驗(yàn)會接近視網(wǎng)膜級清晰度。

為了提升XR設(shè)備的清晰度,2022年P(guān)ICO和供應(yīng)商啟動了MicroOLED定制,這使得光學(xué)顯示系統(tǒng)得以進(jìn)一步縮小,從而讓MR頭顯輕便的同時(shí)獲得更高的PPI和整體清晰度。

字節(jié)跳動VP復(fù)盤12年發(fā)展!劇透明年P(guān)ICO新品、全自研MR芯片

MR設(shè)備需要專用芯片,2022年6月,字節(jié)跳動內(nèi)部立項(xiàng),全鏈路自研了一顆MR頭顯專用的消費(fèi)電子芯片。芯片于2024年回片,目前已進(jìn)入量產(chǎn)階段,各項(xiàng)指標(biāo)均達(dá)到設(shè)計(jì)要求。

其實(shí)測顯示,系統(tǒng)延遲可以做到12毫秒左右,楊震原稱,這非常不容易,即便是世界頂尖公司用軟件來做,也很難在不明顯犧牲畫質(zhì)的前提下把延遲壓到25毫秒以內(nèi)。

還有交互層面,PICO建設(shè)了專業(yè)的高精度測試系統(tǒng)、專門的3D重建機(jī)制與高精度手勢數(shù)據(jù)采集系統(tǒng)等,以對現(xiàn)實(shí)環(huán)境做識別等。

2023年,進(jìn)入大模型時(shí)代,字節(jié)跳動開始大力投入。

2021年,字節(jié)內(nèi)部就有員工訓(xùn)練了大語言模型,但內(nèi)部將其用于改進(jìn)搜索發(fā)現(xiàn)效果并沒有提升。因此當(dāng)時(shí)他們得到的結(jié)論是,大模型目前沒什么用。楊震原說,這也說明當(dāng)時(shí)他們很沒眼光。

2022年開始投入至今,豆包已經(jīng)成為國內(nèi)最流行的AI對話助手,根據(jù)IDC的報(bào)告火山引擎是中國MaaS市場的第一名。

楊震原還分享了他對如何評估是否達(dá)到AGI的看法,第一是如何讓大模型提高學(xué)習(xí)能力,第二是IO能力,也是AI和世界交互的能力。

演講全文地址:https://mp.weixin.qq.com/s/WtN9e5XXwAAaMR2ymNUMuA