日前,開放計算標準工作委員會(OCTC)和OCP中國社區(qū)聯(lián)合主辦了“面向應用的服務器算效標準與評估”開放計算技術沙龍;顒訁R聚了中國電子技術標準化研究院、中石油、中移動、快手、浪潮信息、AMD、Intel、海光信息等研究機構、知名企業(yè)的產學研專家和行業(yè)領袖,對不同應用下算力需求范式變化、面向應用的算力算效評估指標體系構建、提升服務器性能及能效的前沿技術等話題進行了精彩分享和激烈討論。
智能時代計算范式改變,亟需構建面向實際應用的算力算效評價基準
智能時代,從智慧醫(yī)療、智能客服、自動駕駛到智能制造,不同行業(yè)、不同場景的人工智能應用,不僅帶來了算力需求的指數(shù)級增長,也推動了算力發(fā)展范式的變革。以往,以CPU為主的時代,大家追求的是彈性、高效、性價比,然而智能時代,新興場景帶來了差異化的算力需求,傳統(tǒng)以CPU基礎性能為主的評測基準已不再適用,亟需構建面向實際應用的算力算效評價基準。
OCTC秘書長陳海
以應用為中心,推動算力產業(yè)構建AI時代下服務器算力算效評估標準。
在AI和大模型的驅動下,算力產業(yè)從技術、產品到應用場景的變化趨快,同時,國家政策、行業(yè)及用戶對能效和算效的要求亦日益攀升。這就亟需建立適用多場景的服務器算效、能效評價的標準化方案,以確保測評結果精準對接用戶實際需求,為用戶、行業(yè)和廠商提供客觀、準確、完整的評價體系。
中國石油集團東方地球物理公司處理中心原總工程師,教授級高級工程師賴能和
油氣行業(yè)智能化轉型推動算力需求多樣化發(fā)展,算力性能評估需要關注服務器在不同應用中計算精度、網(wǎng)絡架構、存儲和IO系統(tǒng)的平衡以及能效等。
石油產業(yè)鏈長,從勘探開發(fā)的地震數(shù)據(jù)初至波拾取、煉油化工的生產線控制系統(tǒng)到智慧加油站的銷售系統(tǒng),擁有豐富的智能化場景。隨著油氣行業(yè)智能化轉型的推進,應用也在從“高精尖”傳統(tǒng)應用向新興多應用場景拓展,算力需求從高性能計算,向高性能數(shù)據(jù)分析和ML /DL實時計算的AI算力演化,需要面向不同應用場景,針對計算精度、網(wǎng)絡架構、存儲和IO系統(tǒng)的平衡設計等進行服務器系統(tǒng)設計和應用評估,對算力供給的多元化,高能效與綠色低碳提出了更高的要求。
中移動信息技術有限公司項目經(jīng)理李圣義
以科學、系統(tǒng)的評估方法來選擇適合業(yè)務需求的服務器
運營商行業(yè)具有應用場景多樣、多算力并行的業(yè)務特征,需要科學、系統(tǒng)的評估方法來選擇更適合業(yè)務需求的服務器,確保投資的有效性。中國移動一直對算力算效評測標準進行積極探索,通過業(yè)務場景分類、芯片性能評估、系統(tǒng)性能評估、系統(tǒng)功耗評估等一系列技術手段,對服務器算力輸出能力進行綜合分析,為服務器選型、設備利舊等提供衡量參考。
以系統(tǒng)視角全面優(yōu)化,加速服務器算力算效的升級
隨著技術的飛速發(fā)展和應用場景的持續(xù)拓展,對服務器的算力和算效需求正日益攀升,這不僅意味著硬件層面的升級,比如采用性能更強的處理器和更先進的存儲解決方案,也涉及到軟件層面的深度優(yōu)化和系統(tǒng)設計的創(chuàng)新,在OCP中國社區(qū)負責人葉毓睿主持的“服務器算效提升及行業(yè)應用”圓桌討論環(huán)節(jié),嘉賓從技術、應用和系統(tǒng)等不同層面,分享了關于服務器的算效、能效提升的前沿技術思考與展望。
AMD服務器資深系統(tǒng)架構師周景瑜認為,面向應用,芯片計算架構的創(chuàng)新需關注內存、IO等諸多要素。過去20年里,標準服務器的性能基本上每2.4年會翻一倍。而GPU服務器則每2.1年性能提升一倍。服務器計算效率的持續(xù)提升主要源于三大因素:一是整機制程,從28納米演進至當前的3納米,芯片廠商可以在制程迭代,微架構優(yōu)化、及封測方面展開合作,進一步提高每瓦特的性能;二是CXL技術,通過支持CXL 3.1打破內存墻,提高了核存比;三是IO,未來趨勢是減少外部數(shù)據(jù)溝通成本,使用光纖方式傳輸數(shù)據(jù)來提升能效比。
賴能和表示,油氣行業(yè)用戶在評估服務器的性能、能效和計算效率時,需要綜合考量多種因素,不應僅僅關注單臺服務器或工作站的性能,而應更加重視整個系統(tǒng)的性能表現(xiàn)。同時,網(wǎng)絡連接技術對于提升計算性能具有重要作用。隨著處理器核心數(shù)量的不斷增加,算力大幅提升,但未必對所有應用都能達到線性增加,有些并行計算,當核心數(shù)量達到一定數(shù)量后,對并行計算性能效率會有所影響,因此需要從系統(tǒng)架構和應用優(yōu)化兩個層面進行調整優(yōu)化。
快手IDC系統(tǒng)架構師楊琪表示,針對數(shù)據(jù)中心的算力算效與能效的平衡,PUE不一定是唯一的參考標準。對用戶而言,算力提升意味著能加快成果的產出,但有可能會帶來更高的能耗。高算力與低能耗之間的博弈,可能影響數(shù)據(jù)中心的整體收益,需要業(yè)界更深入的探討,比如數(shù)據(jù)中心的液冷供水溫度設定,從35℃降低至25℃,低水溫雖然可能帶來PUE的升高,但是算效也可能提高了,這就需要進一步的綜合評估對比收益是否增加。因此,將算力、算效與PUE結合納入考量指標是未來數(shù)據(jù)中心算效評測發(fā)展的方向。
浪潮信息產品方案開發(fā)部標準認證處經(jīng)理康真健也指出,僅從算力或能效的角度來看,目前的評估標準是割裂的,應該更多地考慮能效和算力產出是否經(jīng)濟。例如,從每消耗一度電或一定的二氧化碳排放量,社會能獲得多少算力價值,來衡量高性能與低能耗之間的關系。比如SPEC組織在制定SART標準時,強調了用戶實際獲得的算力與消耗電力的比值,這是一個需要精確計算的重要指標。
英特爾亞太研發(fā)數(shù)據(jù)中心工程部經(jīng)理沈勇表示,不同行業(yè)應用的算力需求各異,處理器也在面向應用進行不同的優(yōu)化,比如英特爾的新平臺一款是針對性能優(yōu)化的叫性能核,另一款是考慮到客戶對能效的需求,計算性能到一定程度之后更關注能效,提供面向能效優(yōu)化的叫能效核。未來隨著核心數(shù)的增長,如何發(fā)揮最大性能,同時平衡性能與能效會面臨很大挑戰(zhàn),對軟件、生態(tài)提出更高的要求,全產業(yè)鏈合作將成為關鍵。
智能時代的到來推動了算力范式的深刻變革,不同行業(yè)對服務器算效的需求愈發(fā)多樣化和復雜化。在此次沙龍中,產業(yè)界對算效評估標準化高度關注,OCTC也正式公布了面向多樣化應用場景的《服務器算力算效評價規(guī)范》。該規(guī)范面向大數(shù)據(jù)、人工智能等應用場景,由中國電子工業(yè)標準化技術協(xié)會牽頭,業(yè)界芯片廠商、系統(tǒng)廠商及數(shù)據(jù)中心用戶等聯(lián)合參與編制,評測方案、評測工具和標準細則正在制定中。
OCTC熱忱歡迎更多機構及產業(yè)鏈上下游從業(yè)者積極參與,以確保規(guī)范的完善性和適用性,構建開放、公平的服務器算力評估基準,推動算力產業(yè)的快速發(fā)展。