芯東西(公眾號(hào):aichip001)
編譯 | 許丙南
編輯 | 程茜

智東西9月28日消息,9月24日,臺(tái)積電在硅谷圣克拉拉,集中展示了“用AI設(shè)計(jì)AI芯片”的全新設(shè)計(jì)策略,其在芯片工藝、封裝和設(shè)計(jì)流程多維創(chuàng)新下,目標(biāo)是將AI計(jì)算芯片的能效提升約10倍。

據(jù)臺(tái)積電介紹,這一代新型芯片設(shè)計(jì)采用多晶粒(Chiplet)封裝架構(gòu),并通過AI算法優(yōu)化電路布局等方法,大幅減少AI芯片的單位功耗。值得一提的是,EDA軟件廠商Cadence、新思科技等也在論壇上推出了最新的AI設(shè)計(jì)工具。根據(jù)路透社報(bào)道,這些工具在部分復(fù)雜設(shè)計(jì)任務(wù)中的表現(xiàn)已優(yōu)于人工工程師。

用AI設(shè)計(jì)AI芯片!臺(tái)積電秀新策略:Chiplet封裝+AI優(yōu)化電路,推動(dòng)AI計(jì)算芯片能效漲10倍

▲先進(jìn)的3D封裝技術(shù)

一、通信能效提高10倍,光互連提上日程

臺(tái)積電資深研發(fā)副總裁劉立成博士(Dr. LC Liu)透露,由于AI技術(shù)的廣泛應(yīng)用,計(jì)算芯片功耗正在指數(shù)級(jí)攀升。劉立成強(qiáng)調(diào),AI的蓬勃發(fā)展使芯片功耗面臨嚴(yán)峻挑戰(zhàn)。如今AI計(jì)算從超大規(guī)模數(shù)據(jù)中心延伸到邊緣設(shè)備,催生了具身AI、鏈?zhǔn)酵评怼gent代理等新產(chǎn)品,但這些產(chǎn)品需要處理更龐大的數(shù)據(jù)集、進(jìn)行更復(fù)雜的計(jì)算并長時(shí)間運(yùn)行。

他指出,過去五年間AI加速器單顆芯片的封裝功耗提高了3倍,部署規(guī)模在三年內(nèi)增長了8倍。以數(shù)據(jù)中心為例,單機(jī)AI訓(xùn)練服務(wù)器功率動(dòng)輒上千瓦,在同等負(fù)載下相當(dāng)于千戶家庭的用電量。因此,如果無法顯著提升能效,AI算力的可持續(xù)發(fā)展將難以為繼。

用AI設(shè)計(jì)AI芯片!臺(tái)積電秀新策略:Chiplet封裝+AI優(yōu)化電路,推動(dòng)AI計(jì)算芯片能效漲10倍

▲在等功耗下速度從N7到A14提升約1.8倍,功率效率改善約4.2倍

為了應(yīng)對(duì)這一趨勢,臺(tái)積電提出通過先進(jìn)工藝、封裝架構(gòu)和AI設(shè)計(jì)的全方位創(chuàng)新來緩解功耗瓶頸。據(jù)劉立成介紹,臺(tái)積電正從邏輯工藝和3D封裝兩方面同時(shí)發(fā)力,并聯(lián)合生態(tài)伙伴優(yōu)化設(shè)計(jì)方法學(xué),力求將每瓦性能大幅提升。該策略包括進(jìn)一步縮小制程節(jié)點(diǎn)、引入新型背面供電等晶體管技術(shù),以及在封裝層面采用Chiplet小晶粒和垂直3D集成,減少數(shù)據(jù)傳輸損耗和功耗開銷。劉立成指出,只有同時(shí)在工藝、封裝和設(shè)計(jì)生態(tài)上取得突破,才能滿足AI時(shí)代急劇膨脹的算力需求。

在封裝與互連方面,臺(tái)積電聚焦3D芯粒集成和高速通信技術(shù),以打破傳統(tǒng)單芯片的尺寸和I/O瓶頸。臺(tái)積電3DFabric包括SoIC(硅晶圓直接鍵合)、InFO和CoWoS(有機(jī)基板2.5D)以及SoW(硅晶圓級(jí)大規(guī)模封裝)等多項(xiàng)方案,覆蓋從移動(dòng)端到超大規(guī)模AI系統(tǒng)的不同需求。

臺(tái)積電有關(guān)人員此前在技術(shù)研討會(huì)披露,基于臺(tái)積電N12工藝邏輯基底的HBM4高帶寬存儲(chǔ)方案,將比當(dāng)前HBM3e顯著提升1.5倍。若采用臺(tái)積電N3P定制邏輯底板,可將HBM I/O電壓從1.1伏降至0.75伏,進(jìn)一步節(jié)省內(nèi)存訪問功耗。

用AI設(shè)計(jì)AI芯片!臺(tái)積電秀新策略:Chiplet封裝+AI優(yōu)化電路,推動(dòng)AI計(jì)算芯片能效漲10倍

▲HBM4的帶寬與能效表現(xiàn)

在計(jì)算芯片與存儲(chǔ)的互連上,臺(tái)積電持續(xù)縮小晶片間互連間距,其先進(jìn)CoWoS封裝將微凸塊間距從45μm縮小到25μm,使2.5D封裝的能效相較前代提升1.6倍。而采用垂直堆疊的3D SoIC技術(shù),由于省去了有機(jī)中介層,能效相比2.5D方案大幅提高6.7倍(但受限于工藝,目前3D封裝單一基底規(guī)模約為1倍光罩面積,相比2.5D CoWoS最高9.5倍光罩的整合面積略受限制)。

針對(duì)多芯粒系統(tǒng)的高速互連,臺(tái)積電聯(lián)合生態(tài)伙伴提供符合UCIe標(biāo)準(zhǔn)的Die-to-Die接口IP(如Alphawave、新思科技等),確保不同芯粒間的數(shù)據(jù)傳輸高效且兼容。值得關(guān)注的是,光互連技術(shù)也被提上日程:通過硅光子實(shí)現(xiàn)的共封裝光學(xué)(Co-Packaged Optics),有望讓芯片間通信能效提高5-10倍,延遲降低10-20倍,并顯著縮小系統(tǒng)尺寸。臺(tái)積電指出,這將是突破傳統(tǒng)電氣互連物理極限的關(guān)鍵方向。

用AI設(shè)計(jì)AI芯片!臺(tái)積電秀新策略:Chiplet封裝+AI優(yōu)化電路,推動(dòng)AI計(jì)算芯片能效漲10倍

▲引入光學(xué)技術(shù)勢在必行

Meta平臺(tái)基礎(chǔ)架構(gòu)工程師考什克·維拉拉加文(Kaushik Veeraraghavan)在論壇演講中也佐證了這一觀點(diǎn),稱當(dāng)前電子互連已逼近極限,引入光學(xué)技術(shù)勢在必行,“這已不單是工程問題,更是基礎(chǔ)物理瓶頸”。此外,臺(tái)積電聯(lián)合新思科技和ANSYS采用AI協(xié)同優(yōu)化光學(xué)封裝設(shè)計(jì),又進(jìn)一步提升了1.2倍的效率。

為了支撐高功率芯片,臺(tái)積電還開發(fā)了超高性能金屬-絕緣體-金屬電容(UHPMIM)結(jié)合嵌入式深溝電容(EDTC)的解決方案,使電源系統(tǒng)單位面積去耦電容增加1.5倍且無信號(hào)完整性損失。同時(shí),臺(tái)積電引入EDA-AI自動(dòng)化工具,將這種深溝電容的版圖插入效率提高10倍,封裝基板布線效率提升100倍。通過上述封裝和互連創(chuàng)新,臺(tái)積電的能效提升不再僅依賴摩爾定律的晶體管縮放,而是通過封裝與系統(tǒng)層面的集成實(shí)現(xiàn)數(shù)量級(jí)的進(jìn)步。

二、5分鐘完成2天設(shè)計(jì)流程,AI能找到比人更優(yōu)的解決方案

臺(tái)積電宣布與生態(tài)伙伴在EDA軟件上深度合作,利用AI算法來優(yōu)化芯片設(shè)計(jì)流程,從而充分挖掘先進(jìn)工藝和封裝的潛力。

用AI設(shè)計(jì)AI芯片!臺(tái)積電秀新策略:Chiplet封裝+AI優(yōu)化電路,推動(dòng)AI計(jì)算芯片能效漲10倍

▲技術(shù)路線圖

據(jù)路透社消息,Cadence Design Systems與新思科技兩大EDA廠商同步推出了AI驅(qū)動(dòng)的設(shè)計(jì)工具。這些工具與臺(tái)積電的工藝平臺(tái)進(jìn)行了深度對(duì)接,特別是針對(duì)A16(下一代約1.6納米制程技術(shù)節(jié)點(diǎn))、N2P(2納米制程的增強(qiáng)版)、N3(3納米制程技術(shù)節(jié)點(diǎn))等先進(jìn)節(jié)點(diǎn)和3D-IC(三維集成電路技術(shù),將多層芯片堆疊封裝)技術(shù)的AI設(shè)計(jì)認(rèn)證流程。

實(shí)測結(jié)果顯示,在某些復(fù)雜芯片設(shè)計(jì)任務(wù)中,AI工具能夠找到比人工更優(yōu)的解決方案,并將設(shè)計(jì)優(yōu)化時(shí)間從工程師的兩天縮短到幾分鐘。臺(tái)積電3D IC方法學(xué)部門副處長Jim Chang在演講中分享了內(nèi)部實(shí)驗(yàn)數(shù)據(jù)“AI工具僅需5分鐘即可完成工程師需要2天才能完成的優(yōu)化工作”。Cadence稱,基于臺(tái)積電先進(jìn)封裝技術(shù)的HBM4測試芯片已完成設(shè)計(jì)驗(yàn)證,即將流片,為下一代大算力芯片的CoWoS-L封裝打下基礎(chǔ)。

芯片IP供應(yīng)商Rambus與Cadence指出,在邊緣計(jì)算和高級(jí)輔助駕駛(ADAS)場景下,GDDR6顯存以超過20Gbps帶寬提供了高性價(jià)比的方案,新一代GDDR7傳輸速度可達(dá)36Gbps/pin,將滿足未來更高帶寬需求。

結(jié)語:AI需求井噴,倒逼芯片設(shè)計(jì)行業(yè)創(chuàng)新

隨著AI應(yīng)用規(guī)模的快速擴(kuò)展,從數(shù)據(jù)中心到邊緣設(shè)備,全球算力需求呈指數(shù)級(jí)增長,帶動(dòng)芯片功耗同步攀升。在摩爾定律逐步放緩的當(dāng)下,單純依賴晶體管尺寸縮減已難以支撐AI對(duì)性能與能效雙重要求。

在這一背景下,能效革新愈發(fā)重要。值得注意的是,AI本身不僅是算力消耗的主因,更正逐步轉(zhuǎn)化為芯片設(shè)計(jì)領(lǐng)域的提效者。從協(xié)助工程師完成復(fù)雜電路優(yōu)化,到參與能效建模、功耗預(yù)測,AI正深度嵌入EDA工具鏈、封裝架構(gòu)規(guī)劃及能源調(diào)度等多個(gè)環(huán)節(jié)。

來源:路透社、臺(tái)積電、Cadence、Rambus