9月28日,2024中國算力大會發(fā)布“算力中國·最佳學(xué)術(shù)論文”,其中多篇論文的研究成果為業(yè)內(nèi)首創(chuàng),涵蓋算力模型優(yōu)化、綠色算力等領(lǐng)域,將為算力科技突破、應(yīng)用賦能發(fā)揮積極作用。
基礎(chǔ)研究是科技創(chuàng)新的源頭。黨的二十屆三中全會提出,強(qiáng)化基礎(chǔ)研究領(lǐng)域、交叉前沿領(lǐng)域、重點領(lǐng)域前瞻性、引領(lǐng)性布局。算力作為新質(zhì)生產(chǎn)力的代表,是推動新一輪科技革命和產(chǎn)業(yè)變革的加速器,夯實算力領(lǐng)域研究基礎(chǔ),對產(chǎn)業(yè)自主創(chuàng)新和高質(zhì)量發(fā)展具有重要意義。為進(jìn)一步促進(jìn)算力及相關(guān)產(chǎn)業(yè)基礎(chǔ)科研探索,鼓勵基礎(chǔ)理論、方法模式研究,2024中國算力大會面向全球算力及相關(guān)領(lǐng)域的專業(yè)人士發(fā)起“算力中國·最佳學(xué)術(shù)論文”征集活動。
據(jù)介紹,論文包括但不限于通用算力、高性能算力、智能計算、算力應(yīng)用、算力基礎(chǔ)設(shè)施等領(lǐng)域。論文需具備一定的創(chuàng)新性、科學(xué)性、典型性和推廣價值,在算力及相關(guān)產(chǎn)業(yè)的基礎(chǔ)理論、應(yīng)用研究中取得重要突破,在核心技術(shù)、創(chuàng)新應(yīng)用等方面取得顯著成果。
征集活動自啟動以來,得到社會各界廣泛關(guān)注和大力支持。經(jīng)過嚴(yán)格篩選與評審,10篇論文獲評“算力中國·最佳學(xué)術(shù)論文”,包括《面向新一代神威超級計算機(jī)的69.7PFLOPS量級超大規(guī)模地震模擬》《Centauri:通過通信切分實現(xiàn)大模型訓(xùn)練中通信計算重疊的高效調(diào)度》《考慮云計算任務(wù)依賴關(guān)系的數(shù)據(jù)中心園區(qū)用能靈活性方法構(gòu)建與評估》《基于重復(fù)博弈視角的跨孤島聯(lián)邦學(xué)習(xí)中的長期合作》《基于自適應(yīng)引導(dǎo)融合的域泛化深度特征學(xué)習(xí)》《用于分布式訓(xùn)練的傳輸層透明網(wǎng)內(nèi)聚合》《自具微孔聚合物用于膜法精確分離》《NFV網(wǎng)絡(luò)中基于深度學(xué)習(xí)的虛擬網(wǎng)絡(luò)功能優(yōu)化部署研究》《混合概率數(shù)及其神經(jīng)網(wǎng)絡(luò)計算》《深度時序圖聚類》。其中,論文提出的“業(yè)界首個面向AI網(wǎng)絡(luò)的基于RoCE實現(xiàn)的在網(wǎng)計算創(chuàng)新方案”“首次分析并統(tǒng)一了二進(jìn)制數(shù)、概率數(shù)和混合概率數(shù)等三種數(shù)系間的數(shù)理關(guān)系”“首次全面定義了深度時序圖聚類”等成果為業(yè)內(nèi)首創(chuàng)。
評審專家表示,這一系列學(xué)術(shù)研究成果將助推算力基礎(chǔ)研究走深走實,助力我國算力及相關(guān)領(lǐng)域核心技術(shù)自立自強(qiáng)。
“算力中國·最佳學(xué)術(shù)論文”篇目如下:
論文一:
中文名稱:面向新一代神威超級計算機(jī)的69.7PFLOPS量級超大規(guī)模地震模擬
第一作者:萬吳兵
第一作者單位:清華大學(xué)
通訊作者:甘霖、王文強(qiáng)、殷澤坤
合作作者:張振國、田浩東、王一諾、花夢圓、劉小慧、項盛業(yè)、宋澤宇、何仲秋、王子加、高萍、陳垚鍵、段曉輝、劉鑫、張偉、付昊桓、薛巍、劉衛(wèi)國、楊廣文、陳曉非
推薦理由:論文基于新一代國產(chǎn)超級計算機(jī)設(shè)計了一系列全新并行計算方法,形成了一套高精度、高性能地震模擬算法�;谡撐某晒麑崿F(xiàn)了可高效擴(kuò)展至3900萬核計算規(guī)模(擴(kuò)展效率達(dá)98.2%)的超大規(guī)模地震模擬軟件,計算性能達(dá)69.7PFlops。論文進(jìn)一步開展了復(fù)雜地形、真三維復(fù)雜介質(zhì)、12米分辨率、22.6Hz的加州地震模擬。該工作對于使用超級計算機(jī)理解地震的產(chǎn)生原理、傳播機(jī)理和破壞程度等具有重要意義。
論文二:
中文名稱:Centauri:通過通信切分實現(xiàn)大模型訓(xùn)練中通信計算重疊的高效調(diào)度
第一作者:陳暢
第一作者單位:上海人工智能實驗室
通訊作者:楊超、李秀紅
合作作者:朱錢超、段江飛、孫鵬、張行程
推薦理由:Centauri是針對大規(guī)模模型訓(xùn)練過程中巨大的通信開銷,進(jìn)行通信-計算覆蓋優(yōu)化的框架。Centauri包含通信切分和重疊調(diào)度兩個部分。針對“通信是負(fù)載在設(shè)備群上的映射變換”這一核心抽象和模型訓(xùn)練任務(wù)的層級特點,構(gòu)造出全面并且可以系統(tǒng)化探索的切分空間和調(diào)度層級。針對多種不同分布式并行配置下,Centauri對于流行大模型可以提升45%的訓(xùn)練性能。該論文獲得計算機(jī)體系結(jié)構(gòu)國際頂級會議ASPLOS2024最佳論文獎項。
論文三:
中文名稱:考慮云計算任務(wù)依賴關(guān)系的數(shù)據(jù)中心園區(qū)用能靈活性方法構(gòu)建與評估
第一作者:馬佳豪
第一作者單位:阿里云計算有限公司、香港大學(xué)
通訊作者:閆月君、王朝陽
合作作者:姚睿洋、張博超
推薦理由:AI技術(shù)和AI智算市場的快速發(fā)展下,云計算基礎(chǔ)設(shè)施數(shù)據(jù)中心的能耗問題備受關(guān)注。通過挖掘云計算任務(wù)和數(shù)據(jù)中心用能設(shè)備的靈活性,實現(xiàn)數(shù)據(jù)中心彈性用電,對于解決數(shù)據(jù)中心能源問題至關(guān)重要。該論文提出了考慮子任務(wù)依賴關(guān)系的數(shù)據(jù)中心園區(qū)靈活用能模型構(gòu)建方法,通過挖掘AI智算數(shù)據(jù)中心用能靈活性,促進(jìn)園區(qū)同電網(wǎng)協(xié)同用能,服務(wù)AI綠色技術(shù)創(chuàng)新和用戶對綠色服務(wù)的需求,支撐國家東數(shù)西算和雙碳行動,具有積極推廣意義和應(yīng)用價值。
論文四:
中文名稱:基于重復(fù)博弈視角的跨孤島聯(lián)邦學(xué)習(xí)中的長期合作
第一作者:張寧
第一作者單位:中國電信股份有限公司研究院
通訊作者:馬倩
合作作者:陳旭
推薦理由:跨孤島聯(lián)邦學(xué)習(xí)中的搭便車者問題一直對聯(lián)邦學(xué)習(xí)訓(xùn)練造成很大困擾,本文提供了一種具有理論保證的搭便車者的解決方案。本文從階段博弈和重復(fù)博弈角度分別進(jìn)行了理論分析,揭示了搭便車者存在的原因,并提出分布式算法通過鼓勵搭便車者考慮長期收益轉(zhuǎn)而參與訓(xùn)練來解決搭便車者問題,符合現(xiàn)實情況中用戶之間信息不互通的事實。模擬結(jié)果表明文章在最小化搭便車者數(shù)量和最大化模型訓(xùn)練數(shù)據(jù)量的有良好表現(xiàn)。
論文五:
中文名稱:基于自適應(yīng)引導(dǎo)融合的域泛化深度特征學(xué)習(xí)
第一作者:劉麗娜
第一作者單位:中國移動研究院業(yè)務(wù)研究所、浙江大學(xué)
通訊作者:劉勇、宋希彬
合作作者:宋希彬、王蒙蒙、戴玉超、劉勇、張良俊
推薦理由:該論文提出了一種合成到真實域泛化地單目深度估計算法,能夠有效地應(yīng)用在智能交通、智慧城市和三維重建等領(lǐng)域,獲取準(zhǔn)確的深度信息。該論文是發(fā)表于計算機(jī)視覺與模式識別領(lǐng)域國際頂級知名期刊IEEE T-PAMI的最新成果,具有較大的創(chuàng)新性和可推廣價值�?蔀樗懔ο嚓P(guān)的應(yīng)用領(lǐng)域如數(shù)字孿生、世界模型、工業(yè)制造、交通物流和智慧城市等提供可靠和泛化性高的深度結(jié)果和三維信息,對未來提升三維視覺任務(wù)精度和效率提供了重要技術(shù)參考。
論文六:
中文名稱:用于分布式訓(xùn)練的傳輸層透明網(wǎng)內(nèi)聚合
第一作者:劉碩
第一作者單位:華為技術(shù)有限公司
通訊作者:吳文斐
合作作者:Qiaoling Wang、Junyi Zhang、Qinliang Lin、Yao Liu、Meng Xu、Marco Canini、Ray C. C. Cheung、Jianfei He
推薦理由:論文提出的業(yè)界首個面向AI網(wǎng)絡(luò)的基于RoCE實現(xiàn)的在網(wǎng)計算創(chuàng)新方案NetReduce,計劃對標(biāo)英偉達(dá)商用產(chǎn)品SHArP(Scalable Hierachical Aggregation Protocol)可擴(kuò)展層級化聚合協(xié)議。相較于英偉達(dá)基于閉源生態(tài)IB組網(wǎng),NetReduce具有組網(wǎng)規(guī)模更大,成本更低的優(yōu)勢。IB在網(wǎng)計算依賴特定的物理硬件,組網(wǎng)規(guī)模限于子網(wǎng)規(guī)模48K。而以太組網(wǎng)成本大約為IB的0.7~0.8,且擴(kuò)展性方面無子網(wǎng)規(guī)模限制。IB在網(wǎng)計算中,交換機(jī)與服務(wù)器建立RDMA連接,交換機(jī)維護(hù)連接狀態(tài),網(wǎng)絡(luò)復(fù)雜度高。NetReduce保持計算節(jié)點間端到端的可靠傳輸連接,避免在網(wǎng)絡(luò)中維護(hù)過多的狀態(tài)。NetReudce在提升AI網(wǎng)絡(luò)性能的同時,最大程度兼容現(xiàn)有以太網(wǎng)協(xié)議棧,未來可廣泛部署于基于以太網(wǎng)的AI智算中心。
論文七:
中文名稱:自具微孔聚合物用于膜法精確分離
第一作者:馮孝權(quán)
第一作者單位:鄭州大學(xué)
通訊作者:張亞濤、朱軍勇
合作作者:靳健、汪勇、Bart Vander Bruggen
推薦理由:論文以一種具有自具微孔特征的高分子材料(PIMs)為主題,主要對其合成、結(jié)構(gòu)及其在膜分離應(yīng)用領(lǐng)域的發(fā)展做了詳細(xì)闡述。隨著材料科學(xué)快速發(fā)展,文中提出機(jī)器學(xué)習(xí)+AI大模型是設(shè)計、篩選具有特定功能的目標(biāo)材料的一種新范式。基于分子水平上的可控設(shè)計,從材料設(shè)計和功能導(dǎo)向的角度為高性能聚合物材料的設(shè)計、篩選、開發(fā)及分離應(yīng)用提供參考和指導(dǎo)。
論文八:
中文名稱:NFV網(wǎng)絡(luò)中基于深度學(xué)習(xí)的虛擬網(wǎng)絡(luò)功能優(yōu)化部署研究
第一作者:岳毅
第一作者單位:中國聯(lián)通研究院通訊作者:唐雄燕
合作作者:孫世丁、唐雄燕、曹暢、楊文聰
推薦理由:本論文緊密契合算力及相關(guān)產(chǎn)業(yè)的基礎(chǔ)理論與應(yīng)用研究需求,創(chuàng)新性地將深度學(xué)習(xí)應(yīng)用于網(wǎng)絡(luò)功能虛擬化中的虛擬網(wǎng)絡(luò)功能部署。通過構(gòu)建智能節(jié)點選擇神經(jīng)網(wǎng)絡(luò),顯著提高服務(wù)功能鏈(SFC)請求的處理效率和網(wǎng)絡(luò)資源利用率,同時解決了傳統(tǒng)方法在復(fù)雜網(wǎng)絡(luò)環(huán)境下的擴(kuò)展性與靈活性問題,大幅降低計算復(fù)雜度和時間消耗。研究成果已發(fā)表在國際知名的通信領(lǐng)域頂會IEEE WCNC會議上。為未來網(wǎng)絡(luò)架構(gòu)的發(fā)展提供了理論和方法支持的同時,還為智能算力的發(fā)展提供積極啟發(fā)。
論文九:
中文名稱:混合概率數(shù)及其神經(jīng)網(wǎng)絡(luò)計算
第一作者:李洪革
第一作者單位:北京航空航天大學(xué)
通訊作者:李洪革
合作作者:陳宇昊、宋印杰、朱新宇
推薦理由:該研究工作提出了一種全新的二進(jìn)制數(shù)和隨機(jī)概率數(shù)表示的混合數(shù)系統(tǒng)-混合概率數(shù)(Hybrid Stochastic Numbe,HSN)。該研究首次分析并統(tǒng)一了二進(jìn)制數(shù)、概率數(shù)和混合概率數(shù)等三種數(shù)系間的數(shù)理關(guān)系,構(gòu)建了三種數(shù)系間的數(shù)學(xué)表征并分析其高容錯、抗輻照等特性,實現(xiàn)了由該數(shù)系構(gòu)造的智能計算芯片,為進(jìn)一步擴(kuò)展未來顛覆性智能計算體系打下了堅實的數(shù)理基礎(chǔ)。近三年來,該研究成果先后先后被IEEE TVLSI24、TCAS、TVLSI22、ESL、電子學(xué)報和CCF-CHIP、ISVLSI24、ISCAS、DAC61等國際國內(nèi)頂級權(quán)威期刊和大會的多位國際專家高度認(rèn)可并全文發(fā)表。獲2021年度第四屆“華為杯”全國研究生創(chuàng)芯大賽特等獎。2022年榮獲全國集成電路大賽特等獎。該原創(chuàng)性理論和技術(shù)被國務(wù)院發(fā)展研究中心收錄到2023年《世界前沿技術(shù)發(fā)展報告》。
論文十:
中文名稱:深度時序圖聚類
第一作者:劉猛
第一作者單位:國防科技大學(xué)
通訊作者:劉新旺
合作作者:劉悅、梁科、涂文軒、王思為、周思航、劉新旺
推薦理由:該論文首次全面定義了深度時序圖聚類這一新興任務(wù),著重強(qiáng)調(diào)了時序圖聚類因其基于交互序列的批次處理范式,能夠有效緩解在大規(guī)模數(shù)據(jù)集上帶來的內(nèi)存溢出和算力瓶頸問題,是從智能計算視角解決算力問題的典型案例。論文還指出,時序圖聚類因其能夠捕獲關(guān)鍵動態(tài)信息的特性,有望成為現(xiàn)實世界動態(tài)復(fù)雜場景的有效解決方案。該論文發(fā)表于機(jī)器學(xué)習(xí)頂級會議ICLR 2024,受邀在AI TIME、VALSE、PRCV等平臺作宣傳或報告。