首頁|必讀|視頻|專訪|運營|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|博客|特約記者
手機|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計算|芯片報告|智慧城市|移動互聯(lián)網(wǎng)|會展
首頁 >> 頭條資訊 >> 正文

信通院郭亮:我國算力產(chǎn)業(yè)發(fā)展挑戰(zhàn)與建議

2024年4月26日 08:12  中國信通院  

算力作為數(shù)字經(jīng)濟的堅實基礎(chǔ),備受各方關(guān)注。從我國東南沿海到西北內(nèi)陸,從工業(yè)生產(chǎn)到百姓生活,算力正為各行各業(yè)的數(shù)字化注入新動能,成為經(jīng)濟社會高質(zhì)量發(fā)展的重要驅(qū)動力。自《新型數(shù)據(jù)中心發(fā)展三年行動計劃(2021—2023年)》的發(fā)布實施,到生成式人工智能(Artificial Intelligence,AI)大模型掀起AI應用熱潮,再到《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動計劃》的發(fā)布,都將進一步推動我國算力產(chǎn)業(yè)的高質(zhì)量發(fā)展。研究算力發(fā)展實際情況,分析算力發(fā)展現(xiàn)存問題,是制定未來算力發(fā)展策略的關(guān)鍵舉措。本文立足當前我國算力發(fā)展現(xiàn)狀,客觀分析我國算力產(chǎn)業(yè)發(fā)展現(xiàn)存挑戰(zhàn),為推進我國網(wǎng)絡(luò)強國新征程提供發(fā)展建議。

1  我國算力發(fā)展現(xiàn)狀

1.1  算力規(guī)模增長迅猛

近年來,我國數(shù)據(jù)中心在用標準機架數(shù)量年復合增長率超過30%,截至2023年6月,我國在用數(shù)據(jù)中心機架總規(guī)模超過760萬標準機架,算力總規(guī)模達到197 EFLOPS,存力總規(guī)模達到1 080 EB,年增速達到25%。算力設(shè)施內(nèi)、算力設(shè)施間、用戶入算等網(wǎng)絡(luò)創(chuàng)新發(fā)展,有力支撐AI、云—邊—端協(xié)同、“東數(shù)西算”等應用場景。

1.2  布局結(jié)構(gòu)日益優(yōu)化

“東數(shù)西算”實施后,我國西部樞紐算力設(shè)施建設(shè)加快,國家樞紐節(jié)點—省內(nèi)—邊緣協(xié)同發(fā)展的算力梯次布局體系初步形成,算力結(jié)構(gòu)也逐步從早期通用占主體演變?yōu)橥ㄓ谩撬恪銋f(xié)同發(fā)展的格局。隨著AI應用的快速興起,智算中心建設(shè)步伐加快,截至2023年6月,全國已投運的AI計算中心達到25 個,在建的AI計算中心超過20 個,智能算力規(guī)模占整體算力規(guī)模的比例已提高到25.4%。

1.3  算力技術(shù)創(chuàng)新活躍

我國計算機領(lǐng)域發(fā)明申請數(shù)量劇增,算力、存力、運力領(lǐng)域創(chuàng)新成果不斷涌現(xiàn)?萍脊炯铀賵D形處理器(Graphics Processing Unit,GPU)等AI芯片研發(fā),國內(nèi)相關(guān)企業(yè)紛紛推出自研產(chǎn)品;“星河”AI網(wǎng)絡(luò)、先進存儲、液冷技術(shù)等很好地支撐了當前的智算需求。我國在計算、網(wǎng)絡(luò)和存儲方面都取得了很大進展。

1.4  算力賦能產(chǎn)業(yè)發(fā)展

隨著我國算力規(guī)模的持續(xù)擴大,互聯(lián)網(wǎng)、大數(shù)據(jù)、AI等與實體經(jīng)濟融合發(fā)展的新業(yè)態(tài)、新模式正加速涌現(xiàn),算力正加速從互聯(lián)網(wǎng)、電子政務等領(lǐng)域向服務、金融、制造、交通、醫(yī)療等行業(yè)滲透,成為傳統(tǒng)產(chǎn)業(yè)智能化改造和數(shù)字化轉(zhuǎn)型的重要支點。與此同時,算力應用也逐漸向城市治理、智能零售、智能調(diào)度等領(lǐng)域延伸,激發(fā)數(shù)據(jù)要素新活力,助力數(shù)字經(jīng)濟高速發(fā)展。

2  算力發(fā)展面臨的挑戰(zhàn)

2.1  算力協(xié)同仍需穩(wěn)步推進

“東數(shù)西算”工程助力我國算力發(fā)展踏上新臺階,但就目前實施效果來看,距離我國東西部算力協(xié)同均衡發(fā)展仍有差距。首先,我國東西部之間商業(yè)模式協(xié)調(diào)機制仍需持續(xù)完善。我國東西部算力協(xié)作發(fā)展不僅需要依靠自身努力,也需要一定的商業(yè)模式來激勵,我國西部能源供應價格優(yōu)勢與東部產(chǎn)業(yè)西遷成本收益之間的平衡需要一定的協(xié)調(diào)機制來保障。其次,樞紐節(jié)點算力結(jié)構(gòu)需要持續(xù)優(yōu)化。雖然目前我國已在大力推動智算中心建設(shè),但大模型的訓練迭代對智能算力需求的拉動遠超預期,當前樞紐通用算力與智能算力的供需比例仍有一定差距。最后,同質(zhì)化競爭帶來的市場壓力需要調(diào)解。由于同質(zhì)化競爭,部分地區(qū)價格戰(zhàn)加劇,導致原本的成本定價被轉(zhuǎn)變?yōu)槭袌龆▋r,對數(shù)據(jù)中心相關(guān)企業(yè)發(fā)展帶來一定壓力。

2.2  算力生態(tài)仍需持續(xù)完善

近年來,我國不斷鞏固算力基礎(chǔ)設(shè)施,培育算力產(chǎn)業(yè)優(yōu)質(zhì)企業(yè),推進算力賦能經(jīng)濟發(fā)展,健全算力產(chǎn)業(yè)生態(tài),但目前發(fā)展仍需進一步提升,算力生態(tài)建設(shè)仍需持續(xù)完善。我國部分地區(qū)數(shù)據(jù)中心的實際運行業(yè)務效果與算力設(shè)計規(guī)模構(gòu)想存在一定差距,以“筑巢引鳳”的方式實現(xiàn)“新舊”動能轉(zhuǎn)換的期待尚未實現(xiàn),亟待推動從企業(yè)個體的位置空間聚集到有機融合的產(chǎn)業(yè)鏈條聚集,從而促進算力上、下游產(chǎn)業(yè)及應用生態(tài)市場協(xié)同發(fā)展。

算力拉動經(jīng)濟增長的潛力仍有較大挖掘空間。算力產(chǎn)業(yè)發(fā)展與當?shù)刭Y源稟賦結(jié)合不夠緊密的現(xiàn)象仍然存在,導致算力產(chǎn)業(yè)未能深入賦能當?shù)貙嶓w經(jīng)濟發(fā)展,算力產(chǎn)業(yè)發(fā)展帶來的技術(shù)創(chuàng)新和成果尚未充分轉(zhuǎn)化為當?shù)財?shù)字經(jīng)濟的增長動力等問題,仍需持續(xù)開展算力應用賦能的舉措、深挖算力賦能經(jīng)濟增長的潛力空間,將算力真正融入當?shù)貙嶓w產(chǎn)業(yè),充分轉(zhuǎn)化為當?shù)亟?jīng)濟發(fā)展動能。

2.3  算力創(chuàng)新仍需全面提升

大模型等技術(shù)的迅速發(fā)展為算力產(chǎn)業(yè)發(fā)展帶來了新挑戰(zhàn),目前我國算力核心技術(shù)創(chuàng)新力度不夠,技術(shù)方面仍存在相對短板。在綠色低碳方面,我國現(xiàn)有先進數(shù)據(jù)中心電能利用效率最低已達1.05以下,達世界先進水平,但源網(wǎng)荷儲一體化供電系統(tǒng)等低碳發(fā)展重要技術(shù)推廣仍然受限,源荷對接存在一定困難。

在算力調(diào)度方面,部分省市已上線調(diào)度平臺;中國算力平臺持續(xù)完善算力監(jiān)測、匹配和調(diào)度等方面的能力,部署節(jié)奏加快,但算力調(diào)度的商業(yè)模式和技術(shù)細節(jié)仍需進一步探討。在高端芯片和軟件研發(fā)方面,我國自主創(chuàng)新能力仍需加強,對進口產(chǎn)品和技術(shù)仍有一定依賴,關(guān)鍵技術(shù)的“卡脖子”風險依然存在,難以支撐大模型、元宇宙等高性能場景建設(shè)。此外,國產(chǎn)數(shù)據(jù)庫、中間件、操作系統(tǒng)等基礎(chǔ)軟件適配性、兼容性不足,對主流軟件應用環(huán)境構(gòu)建的支撐能力偏弱。

2.4  算力應用仍需深化拓展

當前,我國算力應用行業(yè)持續(xù)多元化拓展,為產(chǎn)業(yè)注入發(fā)展新動能,但算力應用深度仍需推進,算力供給與行業(yè)應用之間的銜接仍需加強。一方面,我國算力提供商缺少一體化解決方案,技術(shù)到落地過程仍存在一定障礙。算力技術(shù)與行業(yè)場景結(jié)合過程中需要較強的行業(yè)經(jīng)驗,而目前我國算力企業(yè)與人才在細分領(lǐng)域的儲備尚不足支撐現(xiàn)有項目的長期深耕和成果應用轉(zhuǎn)化。另一方面,傳統(tǒng)企業(yè)缺乏對算力增益效用的認知與實踐。傳統(tǒng)企業(yè)的數(shù)字化轉(zhuǎn)型日益加速,但現(xiàn)有的算力應用相對較淺,在頂層規(guī)劃、轉(zhuǎn)型方法、項目落地等思維方式和實踐部署方面仍需進一步強化。

2.5  算力安全仍需加強保障

隨著算力向生產(chǎn)生活各個領(lǐng)域的滲透逐漸深入,算網(wǎng)融合持續(xù)推進,算力作為轉(zhuǎn)換數(shù)據(jù)價值的生產(chǎn)要素,安全保障至關(guān)重要,系統(tǒng)安全影響需重視。隨著虛擬化技術(shù)的發(fā)展,算力應用對各種服務組件的依賴加大,而底層服務組件往往支撐著大量業(yè)務,一旦發(fā)生故障,諸多產(chǎn)品將受到影響,引發(fā)行業(yè)震動。

集群安全防護亟需增強。算力產(chǎn)業(yè)不斷集聚發(fā)展,集群部署讓算力資源更為集中,攻擊目標更為明顯,網(wǎng)絡(luò)供給與威脅升級,影響后果更為嚴重,在傳統(tǒng)設(shè)備級、系統(tǒng)級、算力中心級的安全防護基礎(chǔ)上,亟需構(gòu)建集群安全防護體系,增強防護能力。不穩(wěn)定的水電供應,或者對傳輸線路和設(shè)施的物理破壞都會導致算力集群的宕機。

3  算力互聯(lián)面臨的挑戰(zhàn)

3.1  產(chǎn)業(yè)需求無場景大模型訓練需要大規(guī)模的集群算力處理。隨著數(shù)據(jù)并行和模型并行技術(shù)的不斷完善和提升,分布式訓練中可以使用千卡或萬卡規(guī)模的GPU來縮短整體訓練時長。數(shù)據(jù)顯示,GPT-4的參數(shù)規(guī)模為1.8 萬億個,訓練GPT-4約為2.15e25 FLOPS,在大約2.5 萬個A100上訓練了90~100天,利用率僅在32%~36%之間。

2023年,購入超過2萬張GPU卡的國內(nèi)公司僅騰訊、百度、阿里巴巴和字節(jié)跳動4家[5]。為充分發(fā)揮算力算效,這些企業(yè)均自建了大規(guī)模智算集群,為業(yè)內(nèi)提供算力相關(guān)的服務。在正常發(fā)展情況下,未來大模型需要的計算能力相對于目前只增不減。大規(guī)模集群算力處理大模型、小規(guī)模算力處理小模型將成為業(yè)界常態(tài)。

3.2  技術(shù)瓶頸難突破

大模型并行計算模式采用分布式計算能力來處理大量的訓練任務。由于帶寬和時延的限制,并不是把幾個小規(guī)模的集群遠程連起來就能處理大模型。

在完成自身的計算任務后,節(jié)點需要將結(jié)果快速地同步給其他節(jié)點,以便進行下一輪計算;在此之前,計算任務處于等待狀態(tài)。目前,每塊GPU至少會配置100 Gbit/s的網(wǎng)卡,且?guī)捳加幂^滿;如果帶寬不夠,會造成網(wǎng)卡間通信時間變長,影響加速比和訓練效果。算力中心存在大量東西向流量,思科全球云指數(shù)統(tǒng)計,數(shù)據(jù)中心內(nèi)部之間的流量占比為71.49%,隨著智算的爆發(fā),比例會更高。通常每機架配置百兆帶寬,但如果要實現(xiàn)所謂的GPU遠程互聯(lián),理論上單機架兩臺GPU服務器就需要1.6 Tbit/s的帶寬,換算成智算中心的出口帶寬將是天文數(shù)字。

在時延方面,智算中心內(nèi)“一跳可達”的場景下,無限帶寬技術(shù)和基于以太網(wǎng)的遠端直接內(nèi)存訪問技術(shù)均能支持應用層的端到端時延微秒級。為了保證性能損失在5%以內(nèi),數(shù)據(jù)庫集群系統(tǒng)要求至少40 Gbit/s的吞吐和3 μs的網(wǎng)絡(luò)往返時延。目前,北京—呼和浩特的端到端時延為12 ms,是集群內(nèi)應用層端到端時延的1 000 倍。這樣的網(wǎng)絡(luò)時延,對大模型訓練、數(shù)據(jù)庫等應用來說是不可接受的。

3.3  安全穩(wěn)定難保障由于計算量較大,分布式訓練任務需要持續(xù)數(shù)天或數(shù)周。在訓練期間如果出現(xiàn)故障,輕則任務回退到上一個斷點進行重訓,重則整個任務將從0開始。分布式AI計算是同步的,并且希望訓練任務具有可預測的完成時間。在智算網(wǎng)絡(luò)中,每千分之一的丟包將導致網(wǎng)絡(luò)性能下降50%[10]。在正常情況下,互聯(lián)網(wǎng)的丟包率在0%~1%,“盡力而為”的互聯(lián)網(wǎng)顯然不符合智算網(wǎng)絡(luò)的穩(wěn)定性需求。

4  我國算力發(fā)展建議

為進一步推動政策措施有效落地,增強算力應用賦能實效,針對我國算力發(fā)展現(xiàn)存挑戰(zhàn),結(jié)合我國現(xiàn)階段算力產(chǎn)業(yè)發(fā)展基礎(chǔ),提出我國算力高質(zhì)量發(fā)展對策建議。

4.1  以市場為導向,政府引導應用發(fā)展

加強算力發(fā)展的宏觀指引,明確產(chǎn)業(yè)發(fā)展方向。充分發(fā)揮市場作用,在北京、上海、深圳等應用需求旺盛的地區(qū)及其周邊地區(qū)適度加大發(fā)展力度。強化工程的引領(lǐng)作用,通過創(chuàng)建算網(wǎng)城市、打造算力中心標桿等方式形成示范效應,促進各地算力設(shè)施的高質(zhì)量建設(shè)。

4.2  以協(xié)同為重點,推動全面一體發(fā)展

探索解決我國東西部的資源使用和利益分配問題,充分結(jié)合我國東西部自身優(yōu)勢,創(chuàng)新合作模式與機制,鼓勵開展“以數(shù)換電”商業(yè)合作。推動我國西部樞紐緊抓機遇,對算力全產(chǎn)業(yè)鏈進行孵化,構(gòu)建“算力租賃+AI應用”的生態(tài)體系,激活西部算力產(chǎn)業(yè)活力。鼓勵企業(yè)適度超前部署大規(guī)模智算算力,提高算力中心自主可控比例。

4.3  以突破為目標,重點攻關(guān)核心技術(shù)

圍繞算力發(fā)展需要,增強企業(yè)自主創(chuàng)新能力,持續(xù)推進GPU等關(guān)鍵產(chǎn)品和技術(shù)的研發(fā)。推動硬件、基礎(chǔ)軟件、應用軟件等適配協(xié)同,進行算力調(diào)度技術(shù)的應用試驗,形成一批具有自主產(chǎn)權(quán)的完整解決方案。加強對外技術(shù)交流合作,加深算力產(chǎn)業(yè)鏈的溝通協(xié)作。

4.4  以應用為牽引,推進算力賦能產(chǎn)業(yè)

構(gòu)建多部門、多行業(yè)交叉合作機制,充分發(fā)揮算力對工業(yè)、農(nóng)業(yè)、交通、能源、金融和教育等行業(yè)的賦能價值。在項目引進、企業(yè)扶持的過程中,培育算力龍頭企業(yè),協(xié)同帶動算力上下游產(chǎn)業(yè)的發(fā)展,構(gòu)建完善的算力產(chǎn)業(yè)生態(tài)鏈。通過“華彩杯”算力大賽等形式,挖掘并培育優(yōu)質(zhì)算力應用項目,推動優(yōu)秀項目案例的復制推廣。

4.5  以安全為保障,筑牢產(chǎn)業(yè)安全防線

統(tǒng)籌建設(shè)集群級安全防護能力,適當增加算力企業(yè)在安全方面的投入,解決好基礎(chǔ)性問題,打造安全可靠的算網(wǎng)能力。鼓勵算力中心進行多點熱備,實現(xiàn)業(yè)務無縫切換。引導行業(yè)打造安全運維體系,提高運維人員應對突發(fā)事件的應急響應水平。

5  結(jié)束語

《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動計劃》等國家政策文件的發(fā)布,以及GB/T 43331-2023《互聯(lián)網(wǎng)數(shù)據(jù)中心(IDC)技術(shù)和分級要求》等國家標準的實施,都將引領(lǐng)我國算力產(chǎn)業(yè)高質(zhì)量發(fā)展。我國產(chǎn)業(yè)界應針對算力發(fā)展過程中遇到的問題不斷加強技術(shù)攻關(guān),將算力產(chǎn)業(yè)發(fā)展走深向?qū),持續(xù)增強我國算力基礎(chǔ)力量,助力我國早日實現(xiàn)網(wǎng)絡(luò)強國目標。

編 輯:章芳
聲明:刊載本文目的在于傳播更多行業(yè)信息,本站只提供參考并不構(gòu)成任何投資及應用建議。如網(wǎng)站內(nèi)容涉及作品版權(quán)和其它問題,請在30日內(nèi)與本網(wǎng)聯(lián)系,我們將在第一時間刪除內(nèi)容。本站聯(lián)系電話為86-010-87765777,郵件后綴為#cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內(nèi)容核實”、“商務聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
相關(guān)新聞              
 
人物
聞庫:全球6G發(fā)展需要統(tǒng)一的思路、方向和目標
精彩專題
CES 2024國際消費電子展
2023年信息通信產(chǎn)業(yè)盤點暨頒獎禮
飛象網(wǎng)2023年手機評選
第24屆中國國際光電博覽會
CCTIME推薦
關(guān)于我們 | 廣告報價 | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務業(yè)務經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復制、鏡像