必讀視頻專題飛象趣談光通信人工智能低空經(jīng)濟5G手機智能汽車智慧城市會展特約記者

當(dāng)算力告別“野蠻生長”:多芯混戰(zhàn)下睿思智聯(lián)的破局之道

2025年12月1日 13:40CCTIME飛象網(wǎng)

一、洞察:當(dāng)算力告別“野蠻生長”

近期,華為正式開源 AI 容器技術(shù) Flex:ai。

而就在一年前,英偉達以 7 億美元收購 Run:ai,大舉進軍算力精細化管理領(lǐng)域。

當(dāng)全球算力的兩大巨頭 - 英偉達與華為,不約而同地開始在“算力切分”與“統(tǒng)一調(diào)度”上重金押注,一個積極且明確的 AI 行業(yè)分水嶺已經(jīng)出現(xiàn):

單純靠“囤卡”堆性能的草莽階段已經(jīng)過去。

當(dāng)下的競爭,不再是“誰有更多卡”,而是誰能把每張卡“用得更細”、“調(diào)得更準(zhǔn)”和“管得更清”。

但對中國的企業(yè)而言,現(xiàn)實遠比技術(shù)藍圖復(fù)雜。

真實的智算中心,是一場“多芯混戰(zhàn)”

走進一家頭部券商、大型央企或國家級超算中心,更為常見的是:

存量主力:依然是大量尚未淘汰、承載核心業(yè)務(wù)的 NVIDIA P100/T4/V100/A800;

國產(chǎn)新貴:近年來大規(guī)模部署的 華為昇騰 910B2/B3/B4;

百花齊放:更新的機架上,寒武紀(jì)、海光 DCU、昆侖芯、天數(shù)智芯等更多國產(chǎn)卡正在快速上線。

這種 “多代際、多廠商、多架構(gòu)”并存的極度異構(gòu)環(huán)境,才是中國 AI 基礎(chǔ)設(shè)施的真實底色。

Flex:ai 的開放,是縱向生態(tài)的必然

Flex:ai 宣稱兼容 NVIDIA GPU,這無疑是積極信號,它試圖通過軟件層的兼容,降低客戶從 CUDA 生態(tài)遷移到昇騰生態(tài)的門檻。

但從產(chǎn)業(yè)規(guī)律看,任何由硬件廠商主導(dǎo)的調(diào)度平臺,其重心天然向自家芯片傾斜。這并非缺陷,而是生態(tài)定位的必然結(jié)果:廠商平臺的核心使命,是最大化自有硬件的護城河。

而那些非巨頭系的國產(chǎn)芯片(如 寒武紀(jì)、天數(shù)、沐曦、燧原、摩爾線程等),在巨頭生態(tài)中往往只能獲得“有限”的支持。

然而,在眾多算力廠商共存的當(dāng)下,企業(yè)真正需要的,不是一個又一個“生態(tài)內(nèi)的優(yōu)化器”,而是一個不造芯片、不站隊、只做算力管理的第三方平臺:

它不關(guān)心底層是昇騰還是 NVIDIA,只關(guān)心資源是否被高效利用;

它不綁定任何廠商的驅(qū)動棧,而是通過抽象層讓異構(gòu)硬件協(xié)同工作;

它的核心 KPI 不是“賣了多少卡”,而是“企業(yè)的算力 ROI 提升了多少”。

這不僅是技術(shù)選擇,更是供應(yīng)鏈安全與運營效率的戰(zhàn)略平衡。當(dāng)硬件還在“戰(zhàn)國七雄”時代,軟件必須先行統(tǒng)一。

二、K8s是底座,調(diào)度器是“大腦”

Flex:ai 的發(fā)布,再次印證了 Kubernetes(K8s)作為 AI 基礎(chǔ)設(shè)施底座 的不可動搖地位。

但這并不意味著原生 K8s 就能直接勝任 AI 算力管理。恰恰相反,原生 K8s 與 AI 負載之間存在天然“錯配”:它生來為通用計算設(shè)計,而非為昂貴、稀缺、高吞吐的 GPU/NPU 優(yōu)化。

這種“錯配”,導(dǎo)致原生 K8s 在管理 AI 算力時存在兩大核心瓶頸。

瓶頸一:K8s 的“整卡魔咒”

在標(biāo)準(zhǔn) K8s 調(diào)度邏輯中,GPU 被視為“擴展資源”,只能按整卡分配。這意味著:

一個僅需 2GB 顯存的 Jupyter Notebook 調(diào)試任務(wù),會獨占一張 80GB 的 A800;

一張昇騰 910B 無法同時服務(wù)多個小模型推理請求;

一旦任務(wù)啟動,整張卡就被鎖定,即使實際利用率不足 10%。

這種“一刀切”機制,是當(dāng)前智算中心 分配率高(>90%)但是使用率低(<30%) 的根本原因。

瓶頸二:調(diào)度器“不懂 AI”

原生 K8s 調(diào)度器只關(guān)心“節(jié)點是否有空閑資源”,而 AI 任務(wù)對調(diào)度的要求遠不止于此。一個真正“AI 原生”的調(diào)度器,必須具備:

拓撲感知:理解 NVLink/HCCS/XPULink 等互聯(lián)拓撲,讓多卡通信效率翻倍;

優(yōu)先級感知:保障在線推理、實時 Agent 的 SLA,讓離線訓(xùn)練自動讓路;

資源感知:對低利用率資源進行超分復(fù)用,壓榨閑置算力;

業(yè)務(wù)感知:將企業(yè)的組織架構(gòu)、配額管理融入調(diào)度邏輯。

這些能力,原生 K8s 均無法提供,無法滿足 AI 算力“像管理水電一樣管理算力”的需求。

三、HAMi:異構(gòu)調(diào)度的“中立”插件

在 Flex:ai 與 Run:ai 背后,另一條技術(shù)路徑早已在開源社區(qū)悄然生長:HAMi(Heterogeneous AI Computing Virtualization Middleware)。

HAMi 起源于 2019 年第四范式的內(nèi)部 GPU 虛擬化項目(k8s-vgpu-scheduler),2024 年正式捐贈給云原生計算基金會(CNCF),進入 Sandbox 孵化階段。HAMi 自創(chuàng)建之初,目標(biāo)就非常明確:在 Kubernetes 之上,構(gòu)建一個不隸屬于任何硬件廠商的異構(gòu)設(shè)備管理中間件。

當(dāng)智算中心同時運行 NVIDIA、昇騰、寒武紀(jì)、海光、昆侖芯等十余種芯片,企業(yè)面臨一個現(xiàn)實困境:“硬件越多元,調(diào)度越分裂”。

自研調(diào)度系統(tǒng)成本高、周期長;采用某家大廠方案,又可能犧牲其他廠商硬件的調(diào)度潛力。

HAMi 給出了第三個選擇:

開源中立:Apache 2.0 協(xié)議,由社區(qū)驅(qū)動,不為任何硬件廠商站臺;

廣泛兼容:目前已覆蓋 NVIDIA、昇騰、寒武紀(jì)、海光、昆侖芯、天數(shù)智芯、沐曦、摩爾線程等主流芯片。

四、睿思智聯(lián):從開源社區(qū)到企業(yè)級 AI 應(yīng)用平臺

HAMi 證明了“中立調(diào)度”的技術(shù)可行性,但企業(yè)真正需要的,遠不止于“能切分、能調(diào)度”。在 AI 應(yīng)用日益復(fù)雜的今天,從大模型推理、RAG 系統(tǒng),到 Autonomous Agent 編排,企業(yè)亟需一個 "讓AI應(yīng)用平穩(wěn)運行的底座”。

作為 HAMi 的核心貢獻者之一,睿思智聯(lián)基于社區(qū)實踐,已經(jīng)打造了Rise 企業(yè)級平臺:Rise VAST(底層虛擬化引擎)、Rise CAMP(中層算力調(diào)度平臺)和 Rise ModelX(上層模型服務(wù)平臺):

Rise VAST

底層算力虛擬化引擎,讓異構(gòu) GPU/NPU實現(xiàn)任意比例切分、動態(tài)調(diào)度與故障自愈,將集群利用率從 30–50% 提升至 80% 以上,真正釋放國產(chǎn)硬件潛力。

Rise CAMP

中層算力管理與運營平臺,統(tǒng)一調(diào)度多廠商算力,提供智能策略、分鐘級計量計費與全鏈路可觀測性,讓企業(yè)像管理云資源一樣管理 AI 算力。

Rise ModelX

上層大模型服務(wù)平臺,構(gòu)建于 CAMP 之上,支持多推理引擎自動適配、Agent 運行時支撐與 Token 級計費,讓大模型從“一次性產(chǎn)出”變?yōu)榭捎嬃、可服?wù)、可運營的企業(yè)資產(chǎn)。

中立,是企業(yè)級平臺的基石

這一切能力得以成立的前提,是睿思智聯(lián) 堅定的廠商中立立場:

不綁定單一大廠生態(tài),而是協(xié)同合作;

目標(biāo)是“客戶算力利用率提升了多少”、“AI 應(yīng)用交付是否穩(wěn)定”等業(yè)務(wù)價值的提升。

在硬件碎片化不可逆的今天,這種中立性,已從技術(shù)選擇升維為企業(yè) AI 基礎(chǔ)設(shè)施的戰(zhàn)略必需品。

睿思智聯(lián)的定位從創(chuàng)立之初就很清晰,這一選擇不是技術(shù)路線的權(quán)宜之計,而是對行業(yè)本質(zhì)的深刻洞察:

開放協(xié)作:我們持續(xù)與各大芯片廠商深度合作,共同完善異構(gòu)調(diào)度標(biāo)準(zhǔn),確保底層技術(shù)的開放性與兼容性,并積極回饋給開源社區(qū);

精細運營:將社區(qū)最佳實踐轉(zhuǎn)化為企業(yè)級產(chǎn)品,通過分鐘級計量計費、多維度成本分?jǐn)、自動化資源回收,幫助企業(yè)建立算力使用運營體系;

業(yè)務(wù)賦能:我們的成功標(biāo)準(zhǔn)與客戶業(yè)務(wù)成果直接掛鉤,客戶成功團隊的KPI與客戶算力利用率提升、AI應(yīng)用交付效率、業(yè)務(wù)創(chuàng)新速度緊密關(guān)聯(lián),確保技術(shù)投入轉(zhuǎn)化為真實業(yè)務(wù)價值。

價值不是口號,而是可量化的業(yè)務(wù)成果。在AI投入持續(xù)增長的今天,企業(yè)需要的不僅是技術(shù)工具,更是能帶來明確投資回報的合作伙伴。睿思智聯(lián)致力于成為這樣的伙伴:

“讓算力真正驅(qū)動業(yè)務(wù)創(chuàng)新,而非成為成本負擔(dān)“。

五、結(jié)語:協(xié)同是多芯時代的最優(yōu)解

當(dāng) Flex:ai 與 Run:ai 相繼登場,行業(yè)共識已然清晰:AI 算力的下半場,屬于精細化調(diào)度與高效運營。

但在中國“多芯混戰(zhàn)”的現(xiàn)實下,單靠某一家廠商的調(diào)度方案,難以真正釋放異構(gòu)算力的全部潛力。無論是 NVIDIA、昇騰,還是寒武紀(jì)、海光、昆侖芯,每一塊國產(chǎn)芯片都值得被平等調(diào)度、被精細使用、被高效協(xié)同。

這需要一個 “開放、中立、可擴展”的 AI 算力協(xié)同平臺“,它不替代任何硬件,而是讓所有硬件更好地協(xié)同工作;它不綁定任何生態(tài),而是為所有生態(tài)提供統(tǒng)一接口。

睿思智聯(lián)始終相信:開源是實現(xiàn)協(xié)同的最佳路徑。我們呼吁更多芯片廠商、軟件伙伴擁抱開源技術(shù),共同完善異構(gòu)調(diào)度標(biāo)準(zhǔn),讓國產(chǎn)芯片在統(tǒng)一平臺上發(fā)揮更大價值。

未來,睿思智聯(lián)將繼續(xù)深耕 Rise 企業(yè)級平臺,同時堅定回饋 HAMi 社區(qū),推動“開源為基、商業(yè)為用”的雙輪驅(qū)動模式。睿思智聯(lián)的目標(biāo)不是成為又一個調(diào)度插件,而是構(gòu)建一個真正中立、自主可控、可擴展、可運營的 AI 算力協(xié)同底座 - 讓每一份算力投入都能轉(zhuǎn)化為業(yè)務(wù)創(chuàng)新,讓AI應(yīng)用穩(wěn)定運行而不過度消耗資源,讓技術(shù)團隊專注創(chuàng)造而非運維救火。

編 輯:T01
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載,請必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問題,請在相關(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內(nèi)容核實”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
推薦閱讀

精彩視頻

精彩專題

關(guān)于我們廣告報價聯(lián)系我們隱私聲明本站地圖

CCTIME飛象網(wǎng) CopyRight © 2007-2025 By CCTIME.COM

京ICP備08004280號-1 電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號

公司名稱: 北京飛象互動文化傳媒有限公司

未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像