每日微信報
人物專訪監(jiān)管
制造芯片
6G 運營
大數(shù)據(jù)物聯(lián)網(wǎng)
移動互聯(lián)網(wǎng)量子
云計算互聯(lián)網(wǎng)
報告衛(wèi)星

當(dāng)算力告別“野蠻生長”：多芯混戰(zhàn)下睿思智聯(lián)的破局之道

2025年12月1日 13:40CCTIME飛象網(wǎng)

一、洞察：當(dāng)算力告別“野蠻生長”

近期，華為正式開源 AI 容器技術(shù) Flex:ai。

而就在一年前，英偉達以 7 億美元收購 Run:ai，大舉進軍算力精細化管理領(lǐng)域。

當(dāng)全球算力的兩大巨頭 - 英偉達與華為，不約而同地開始在“算力切分”與“統(tǒng)一調(diào)度”上重金押注，一個積極且明確的 AI 行業(yè)分水嶺已經(jīng)出現(xiàn)：

單純靠“囤卡”堆性能的草莽階段已經(jīng)過去。

當(dāng)下的競爭，不再是“誰有更多卡”，而是誰能把每張卡“用得更細”、“調(diào)得更準(zhǔn)”和“管得更清”。

但對中國的企業(yè)而言，現(xiàn)實遠比技術(shù)藍圖復(fù)雜。

真實的智算中心，是一場“多芯混戰(zhàn)”

走進一家頭部券商、大型央企或國家級超算中心，更為常見的是：

存量主力：依然是大量尚未淘汰、承載核心業(yè)務(wù)的 NVIDIA P100/T4/V100/A800；

國產(chǎn)新貴：近年來大規(guī)模部署的華為昇騰 910B2/B3/B4；

百花齊放：更新的機架上，寒武紀(jì)、海光 DCU、昆侖芯、天數(shù)智芯等更多國產(chǎn)卡正在快速上線。

這種 “多代際、多廠商、多架構(gòu)”并存的極度異構(gòu)環(huán)境，才是中國 AI 基礎(chǔ)設(shè)施的真實底色。

Flex:ai 的開放，是縱向生態(tài)的必然

Flex:ai 宣稱兼容 NVIDIA GPU，這無疑是積極信號，它試圖通過軟件層的兼容，降低客戶從 CUDA 生態(tài)遷移到昇騰生態(tài)的門檻。

但從產(chǎn)業(yè)規(guī)律看，任何由硬件廠商主導(dǎo)的調(diào)度平臺，其重心天然向自家芯片傾斜。這并非缺陷，而是生態(tài)定位的必然結(jié)果：廠商平臺的核心使命，是最大化自有硬件的護城河。

而那些非巨頭系的國產(chǎn)芯片（如寒武紀(jì)、天數(shù)、沐曦、燧原、摩爾線程等），在巨頭生態(tài)中往往只能獲得“有限”的支持。

然而，在眾多算力廠商共存的當(dāng)下，企業(yè)真正需要的，不是一個又一個“生態(tài)內(nèi)的優(yōu)化器”，而是一個不造芯片、不站隊、只做算力管理的第三方平臺：

它不關(guān)心底層是昇騰還是 NVIDIA，只關(guān)心資源是否被高效利用；

它不綁定任何廠商的驅(qū)動棧，而是通過抽象層讓異構(gòu)硬件協(xié)同工作；

它的核心 KPI 不是“賣了多少卡”，而是“企業(yè)的算力 ROI 提升了多少”。

這不僅是技術(shù)選擇，更是供應(yīng)鏈安全與運營效率的戰(zhàn)略平衡。當(dāng)硬件還在“戰(zhàn)國七雄”時代，軟件必須先行統(tǒng)一。

二、K8s是底座，調(diào)度器是“大腦”

Flex:ai 的發(fā)布，再次印證了 Kubernetes（K8s）作為 AI 基礎(chǔ)設(shè)施底座的不可動搖地位。

但這并不意味著原生 K8s 就能直接勝任 AI 算力管理。恰恰相反，原生 K8s 與 AI 負載之間存在天然“錯配”：它生來為通用計算設(shè)計，而非為昂貴、稀缺、高吞吐的 GPU/NPU 優(yōu)化。

這種“錯配”，導(dǎo)致原生 K8s 在管理 AI 算力時存在兩大核心瓶頸。

瓶頸一：K8s 的“整卡魔咒”

在標(biāo)準(zhǔn) K8s 調(diào)度邏輯中，GPU 被視為“擴展資源”，只能按整卡分配。這意味著：

一個僅需 2GB 顯存的 Jupyter Notebook 調(diào)試任務(wù)，會獨占一張 80GB 的 A800；

一張昇騰 910B 無法同時服務(wù)多個小模型推理請求；

一旦任務(wù)啟動，整張卡就被鎖定，即使實際利用率不足 10%。

這種“一刀切”機制，是當(dāng)前智算中心分配率高（>90%）但是使用率低（<30%）的根本原因。

瓶頸二：調(diào)度器“不懂 AI”

原生 K8s 調(diào)度器只關(guān)心“節(jié)點是否有空閑資源”，而 AI 任務(wù)對調(diào)度的要求遠不止于此。一個真正“AI 原生”的調(diào)度器，必須具備：

拓撲感知：理解 NVLink/HCCS/XPULink 等互聯(lián)拓撲，讓多卡通信效率翻倍；

優(yōu)先級感知：保障在線推理、實時 Agent 的 SLA，讓離線訓(xùn)練自動讓路；

資源感知：對低利用率資源進行超分復(fù)用，壓榨閑置算力；

業(yè)務(wù)感知：將企業(yè)的組織架構(gòu)、配額管理融入調(diào)度邏輯。

這些能力，原生 K8s 均無法提供，無法滿足 AI 算力“像管理水電一樣管理算力”的需求。

三、HAMi：異構(gòu)調(diào)度的“中立”插件

在 Flex:ai 與 Run:ai 背后，另一條技術(shù)路徑早已在開源社區(qū)悄然生長：HAMi（Heterogeneous AI Computing Virtualization Middleware）。

HAMi 起源于 2019 年第四范式的內(nèi)部 GPU 虛擬化項目（k8s-vgpu-scheduler），2024 年正式捐贈給云原生計算基金會（CNCF），進入 Sandbox 孵化階段。HAMi 自創(chuàng)建之初，目標(biāo)就非常明確：在 Kubernetes 之上，構(gòu)建一個不隸屬于任何硬件廠商的異構(gòu)設(shè)備管理中間件。

當(dāng)智算中心同時運行 NVIDIA、昇騰、寒武紀(jì)、海光、昆侖芯等十余種芯片，企業(yè)面臨一個現(xiàn)實困境：“硬件越多元，調(diào)度越分裂”。

自研調(diào)度系統(tǒng)成本高、周期長；采用某家大廠方案，又可能犧牲其他廠商硬件的調(diào)度潛力。

HAMi 給出了第三個選擇：

開源中立：Apache 2.0 協(xié)議，由社區(qū)驅(qū)動，不為任何硬件廠商站臺；

廣泛兼容：目前已覆蓋 NVIDIA、昇騰、寒武紀(jì)、海光、昆侖芯、天數(shù)智芯、沐曦、摩爾線程等主流芯片。

四、睿思智聯(lián)：從開源社區(qū)到企業(yè)級 AI 應(yīng)用平臺

HAMi 證明了“中立調(diào)度”的技術(shù)可行性，但企業(yè)真正需要的，遠不止于“能切分、能調(diào)度”。在 AI 應(yīng)用日益復(fù)雜的今天，從大模型推理、RAG 系統(tǒng)，到 Autonomous Agent 編排，企業(yè)亟需一個 "讓AI應(yīng)用平穩(wěn)運行的底座”。

作為 HAMi 的核心貢獻者之一，睿思智聯(lián)基于社區(qū)實踐，已經(jīng)打造了Rise 企業(yè)級平臺：Rise VAST（底層虛擬化引擎）、Rise CAMP（中層算力調(diào)度平臺）和 Rise ModelX（上層模型服務(wù)平臺）：

Rise VAST

底層算力虛擬化引擎，讓異構(gòu) GPU/NPU實現(xiàn)任意比例切分、動態(tài)調(diào)度與故障自愈，將集群利用率從 30–50% 提升至 80% 以上，真正釋放國產(chǎn)硬件潛力。

Rise CAMP

中層算力管理與運營平臺，統(tǒng)一調(diào)度多廠商算力，提供智能策略、分鐘級計量計費與全鏈路可觀測性，讓企業(yè)像管理云資源一樣管理 AI 算力。

Rise ModelX

上層大模型服務(wù)平臺，構(gòu)建于 CAMP 之上，支持多推理引擎自動適配、Agent 運行時支撐與 Token 級計費，讓大模型從“一次性產(chǎn)出”變?yōu)榭捎嬃�、可服�?wù)、可運營的企業(yè)資產(chǎn)。

中立，是企業(yè)級平臺的基石

這一切能力得以成立的前提，是睿思智聯(lián) 堅定的廠商中立立場：

不綁定單一大廠生態(tài)，而是協(xié)同合作；

目標(biāo)是“客戶算力利用率提升了多少”、“AI 應(yīng)用交付是否穩(wěn)定”等業(yè)務(wù)價值的提升。

在硬件碎片化不可逆的今天，這種中立性，已從技術(shù)選擇升維為企業(yè) AI 基礎(chǔ)設(shè)施的戰(zhàn)略必需品。

睿思智聯(lián)的定位從創(chuàng)立之初就很清晰，這一選擇不是技術(shù)路線的權(quán)宜之計，而是對行業(yè)本質(zhì)的深刻洞察：

開放協(xié)作：我們持續(xù)與各大芯片廠商深度合作，共同完善異構(gòu)調(diào)度標(biāo)準(zhǔn)，確保底層技術(shù)的開放性與兼容性，并積極回饋給開源社區(qū)；

精細運營：將社區(qū)最佳實踐轉(zhuǎn)化為企業(yè)級產(chǎn)品，通過分鐘級計量計費、多維度成本分?jǐn)�、自動化資源回收，幫助企業(yè)建立算力使用運營體系；

業(yè)務(wù)賦能：我們的成功標(biāo)準(zhǔn)與客戶業(yè)務(wù)成果直接掛鉤，客戶成功團隊的KPI與客戶算力利用率提升、AI應(yīng)用交付效率、業(yè)務(wù)創(chuàng)新速度緊密關(guān)聯(lián)，確保技術(shù)投入轉(zhuǎn)化為真實業(yè)務(wù)價值。

價值不是口號，而是可量化的業(yè)務(wù)成果。在AI投入持續(xù)增長的今天，企業(yè)需要的不僅是技術(shù)工具，更是能帶來明確投資回報的合作伙伴。睿思智聯(lián)致力于成為這樣的伙伴：

“讓算力真正驅(qū)動業(yè)務(wù)創(chuàng)新，而非成為成本負擔(dān)“。

五、結(jié)語：協(xié)同是多芯時代的最優(yōu)解

當(dāng) Flex:ai 與 Run:ai 相繼登場，行業(yè)共識已然清晰：AI 算力的下半場，屬于精細化調(diào)度與高效運營。

但在中國“多芯混戰(zhàn)”的現(xiàn)實下，單靠某一家廠商的調(diào)度方案，難以真正釋放異構(gòu)算力的全部潛力。無論是 NVIDIA、昇騰，還是寒武紀(jì)、海光、昆侖芯，每一塊國產(chǎn)芯片都值得被平等調(diào)度、被精細使用、被高效協(xié)同。

這需要一個 “開放、中立、可擴展”的 AI 算力協(xié)同平臺“，它不替代任何硬件，而是讓所有硬件更好地協(xié)同工作；它不綁定任何生態(tài)，而是為所有生態(tài)提供統(tǒng)一接口。

睿思智聯(lián)始終相信：開源是實現(xiàn)協(xié)同的最佳路徑。我們呼吁更多芯片廠商、軟件伙伴擁抱開源技術(shù)，共同完善異構(gòu)調(diào)度標(biāo)準(zhǔn)，讓國產(chǎn)芯片在統(tǒng)一平臺上發(fā)揮更大價值。

未來，睿思智聯(lián)將繼續(xù)深耕 Rise 企業(yè)級平臺，同時堅定回饋 HAMi 社區(qū)，推動“開源為基、商業(yè)為用”的雙輪驅(qū)動模式。睿思智聯(lián)的目標(biāo)不是成為又一個調(diào)度插件，而是構(gòu)建一個真正中立、自主可控、可擴展、可運營的 AI 算力協(xié)同底座 - 讓每一份算力投入都能轉(zhuǎn)化為業(yè)務(wù)創(chuàng)新，讓AI應(yīng)用穩(wěn)定運行而不過度消耗資源，讓技術(shù)團隊專注創(chuàng)造而非運維救火。

編輯：T01

飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容，凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有，未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像，違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載，請必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性，并完整標(biāo)注作者信息和飛象網(wǎng)來源。
2.凡注明“來源：XXXX”的作品，均轉(zhuǎn)載自其它媒體，在于傳播更多行業(yè)信息，并不代表本網(wǎng)贊同其觀點和對其真實性負責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問題，請在相關(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系，我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777，郵件后綴為cctime.com，冒充本站員工以任何其他聯(lián)系方式，進行的“內(nèi)容核實”、“商務(wù)聯(lián)系”等行為，均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。