首頁|必讀|視頻|專訪|運營|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網|量子|低空經濟|智能汽車|特約記者
手機|互聯(lián)網|IT|5G|光通信|人工智能|云計算|芯片|報告|智慧城市|移動互聯(lián)網|會展
首頁 >> 頭條資訊 >> 正文

科大訊飛聯(lián)合華為!率先實現(xiàn)國產算力大規(guī)?绻(jié)點專家并行集群推理

2025年3月12日 07:52  新浪科技  作 者:羅寧

3月11日下午消息,近日,科大訊飛(51.980, -0.17, -0.33%)攜手華為在國產算力領域取得重大進展,雙方聯(lián)合團隊率先突破國產算力集群上MoE模型的大規(guī)?绻(jié)點專家并行集群推理,這是繼DeepSeek公布其MoE模型訓練推理方案后,業(yè)界首個基于國產算力的全新解決方案。

聯(lián)合團隊通過軟硬件的深度協(xié)同創(chuàng)新,在多個關鍵技術層面深挖硬件潛力,完成昇騰集群上的驗證和部署。在算子融合方面,團隊在MLA預處理階段通過Vector與Cube異構計算單元并行流水,并將多個小算子融合重構為原子級計算單元,消除小算子下發(fā)開銷,MLA前處理時延降低50%+,實現(xiàn)性能的顯著提升。

在混合并行策略和通信計算并行優(yōu)化方面,團隊構建了TP(張量并行)+EP(專家并行)混合范式:對MLA計算層采用機內TP并行,發(fā)揮機內高速互聯(lián)優(yōu)勢,降低跨機通信損耗;創(chuàng)新MoE專家分層調度,64卡均衡分配專家計算節(jié)點,定制AllToAll通信協(xié)議,專家數(shù)據(jù)交換效率提升40%,構建跨機/機內雙層通信架構,通過分層優(yōu)化降低跨機流量60%;同時研發(fā)路由專家負載均衡算法,實現(xiàn)卡間負載差異小于10%,集群吞吐提升30%。

通過分布式架構創(chuàng)新與算法協(xié)同優(yōu)化,聯(lián)合團隊在國產算力上實現(xiàn)了顯著的性能提升。單卡靜態(tài)內存占用縮減至雙機部署的1/4,效率提升75%,專家計算密度增加4倍,推理吞吐提升3.2倍,端到端時延降低50%。

科大訊飛研究院表示,這一突破性的解決方案也將應用于訊飛星火深度推理模型的訓練加速,預期訓練時推理效率將提升200%。同時,基于該方案的推理引擎也實現(xiàn)了國產算力上DeepSeek V3和R1的高效推理。

編 輯:章芳
飛象網版權及免責聲明:
1.本網刊載內容,凡注明來源為“飛象網”和“飛象原創(chuàng)”皆屬飛象網版權所有,未經允許禁止轉載、摘編及鏡像,違者必究。對于經過授權可以轉載,請必須保持轉載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網來源。
2.凡注明“來源:XXXX”的作品,均轉載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網贊同其觀點和對其真實性負責。
3.如因作品內容、版權和其它問題,請在相關作品刊發(fā)之日起30日內與本網聯(lián)系,我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內容核實”、“商務聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
相關新聞              
 
人物
vivo胡柏山:手機行業(yè)是最典型的新質生產力代表
精彩專題
聚焦2025全國兩會
2025年世界移動通信大會
低空經濟2025:助力中國經濟騰飛,成就高質量發(fā)展
2024通信業(yè)年終盤點
CCTIME推薦
關于我們 | 廣告報價 | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網 CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務業(yè)務經營許可證080234號 京公網安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經書面許可,禁止轉載、摘編、復制、鏡像