國內(nèi)首顆量產(chǎn)全功能DPU面市 隨智算中心鋪開有望迎需求放量
原創(chuàng)
2024-06-20 20:52 星期四
科創(chuàng)板日報記者 郭輝
①中科馭數(shù)第三代DPU芯片K2-Pro正式發(fā)布,產(chǎn)品主要面向未來數(shù)據(jù)中心和云原生環(huán)境并進行了定制優(yōu)化;
②在算網(wǎng)融合的技術(shù)發(fā)展與應用下,DPU等一類用于加速各種數(shù)據(jù)處理的產(chǎn)品重要性凸顯,中科馭數(shù)CEO鄢貴海表示,網(wǎng)中有算這件事情,只有DPU可以干。

《科創(chuàng)板日報》6月20日訊(記者 郭輝) 國內(nèi)首顆量產(chǎn)全功能DPU算力芯片面市。

昨日(6月19日),中科馭數(shù)第三代DPU芯片K2-Pro正式發(fā)布。K2-Pro是目前國內(nèi)首顆量產(chǎn)全功能DPU算力芯片,產(chǎn)品主要面向未來數(shù)據(jù)中心和云原生環(huán)境并進行了定制優(yōu)化。

據(jù)了解,在數(shù)據(jù)處理方面,K2-Pro包處理速率可達80Mpps,復雜服務網(wǎng)格性能從400微秒降至30微秒以內(nèi)。通過PPP、NP內(nèi)核及P4可編程架構(gòu),K2-Pro能夠?qū)崿F(xiàn)業(yè)務與同構(gòu)算力、異構(gòu)算力靈活擴展;在DPU復雜場景下,能耗較上一代降低30%。

image

在算網(wǎng)融合的技術(shù)發(fā)展與應用下,DPU等一類用于加速各種數(shù)據(jù)處理的產(chǎn)品,重要性凸顯。然而與之伴隨的是,DPU這一產(chǎn)品概念在近幾年發(fā)展中受到不少爭議,比如DPU與智能網(wǎng)卡功能與定位是否重合,英偉達等廠商對DPU的公開討論越來越少是否意味著被戰(zhàn)略性放棄等。

中科馭數(shù)CEO鄢貴海表示:“網(wǎng)中有算這件事情,只有DPU可以干,這樣的負載類型不是單純靠CPU能夠處理?!睋?jù)介紹,為應對行業(yè)趨勢,中科馭數(shù)對DPU的定義跟設計也有相應變化,不再將DPU視為單一芯片,而是從先進芯片架構(gòu)、高兼容性的軟件生態(tài)、低成本部署及業(yè)務驗證等三個維度重新定義其價值。

關(guān)于DPU在新的發(fā)展階段的新思考,在發(fā)布會后,中科馭數(shù)CEO鄢貴海、CTO盧文巖、高級副總裁張宇接受了《科創(chuàng)板日報》在內(nèi)的媒體采訪。

國產(chǎn)DPU概念需要重新被定義

DPU是進行算網(wǎng)融合的關(guān)鍵組件”。鄢貴海表示,如今DPU應用絕對不僅是卸載部分CPU負載那么簡單,“有些任務——比如處理安全上的業(yè)務、做分布式安全機制等,不僅GPU干不了,CPU本身也不太能有效處理,而在DPU上做這件事情就會非常簡單”。在中科馭數(shù)看來,DPU功能不僅需要提高算網(wǎng)的計算集群效率,同時還要求能夠提高計算集群運維水平、提高集群整體算力規(guī)模。

算網(wǎng)融合是以通信網(wǎng)絡設施和計算設施的融合發(fā)展為基礎(chǔ),通過計算、存儲及網(wǎng)絡資源統(tǒng)一編排管控,滿足業(yè)務對網(wǎng)絡和算力靈活泛在、彈性敏捷、智能隨機應用需求的一種新型業(yè)務模式。

從兩年前東數(shù)西算國家戰(zhàn)略的引入,逐步到去年年底算力基礎(chǔ)設施高質(zhì)量發(fā)展行動規(guī)劃發(fā)布,到今年各地智算中心全面鋪開,算網(wǎng)一體化模式已深入眾多產(chǎn)業(yè)的技術(shù)迭代和應用發(fā)展的大節(jié)奏之中。

其中,DPU也從以前服務器板卡的產(chǎn)品形態(tài)進一步發(fā)展,時至今日承擔了越來越重要的算力來源支撐。

鄢貴海表示,DPU需要被重新定義,不能單純只搞芯片這一件事情。DPU本身功能,如果還是與原來狹義理解的DPU負責卸載CPU負載的視角去看待,顯然太過于局限。就像現(xiàn)在看計算機系統(tǒng),應該要看整體的分布式集群性系統(tǒng)一樣?!艾F(xiàn)在DPU也要逐步建立起軟件的護城河,還要做好平臺上門,用最低的成本讓客戶接入DPU規(guī)?;渴鹋c業(yè)務驗證,讓DPU軟硬件技術(shù)在云里面落地生根?!?/p>

民生證券研究報告觀點認為,得益于智能網(wǎng)卡方案的逐步成熟,疊加全球通用服務器出貨量的穩(wěn)定增長、L3以上級別智能駕駛汽車的技術(shù)落地、工業(yè)控制領(lǐng)域的需求增加等原因,全球、國內(nèi)DPU產(chǎn)業(yè)均有望實現(xiàn)快速發(fā)展。

DPU未來應用需進一步融入高算力節(jié)點

DPU的技術(shù)和功能價值過去也得到了英偉達這樣的行業(yè)巨頭認可。2020年,英偉達在GTC戰(zhàn)略發(fā)布中將DPU定義為“第三顆主力芯片”。基于GPU、DPU和CPU三種新一代架構(gòu)構(gòu)建的NVIDIA加速計算平臺,英偉達目標指向重塑AI時代的數(shù)據(jù)中心。

據(jù)了解,DPU由基礎(chǔ)網(wǎng)卡進化而來,具有獨立計算單元是DPU相較于普通網(wǎng)卡的主要特征,可通過ASIC/FPGA/SoC等技術(shù)實現(xiàn)。從核心功能來看,DPU主要是從CPU上卸載關(guān)鍵網(wǎng)絡、存儲、安全任務,以降低CPU的運算壓力,從而提升整個數(shù)據(jù)中心的運行效率。

然而近兩年DPU的定位和功能也受到一定挑戰(zhàn)。最直觀的感受是,英偉達如今已經(jīng)很少公開單獨談論DPU了,而且國內(nèi)涌現(xiàn)出來的主打DPU產(chǎn)品的廠商,也不如GPU/CPU的項目多。

鄢貴海認為,其中的緣由與英偉達自身的技術(shù)概念營銷及產(chǎn)品方案策略有關(guān),國外芯片巨頭對其DPU產(chǎn)品形態(tài)和定位的調(diào)整依然值得關(guān)注。與此同時,在“大廠弊病”之下,這些巨頭產(chǎn)品迭代節(jié)奏降緩,對于國內(nèi)廠商來說反而是機會。

“2021年DPU熱度達到高峰,到2022年行業(yè)形成聚力,再到2023年、2024年迎來產(chǎn)品大規(guī)模應用的關(guān)鍵階段,其間英偉達逐步把原來狹義的DPU剝離了出來,并將DPU概念轉(zhuǎn)移到到NV-Link上,只是不把NV-Link叫DPU,這更多是一種概念的營銷?!?/p>

鄢貴海表示,英偉達在推產(chǎn)品時,基本是以集群的形式、以完整的高算力節(jié)點來作為產(chǎn)品形態(tài)。在DPU產(chǎn)品方面,英偉達并沒有加以弱化,DGX里面仍然在部署DPU系統(tǒng)。

端側(cè)加上DPU和已經(jīng)非常完善的CX系列高性能網(wǎng)卡,“可以說全都是英偉達的王牌,但不會像之前一樣全都亮出來”。鄢貴海認為,英偉達的一體化技術(shù),重型行業(yè)游戲規(guī)則,對國內(nèi)未來做算力或大規(guī)模芯片相關(guān)的廠商來說,是一個非常好的指向。

除英偉達外,英特爾與AMD兩家芯片巨頭亦有DPU項目的布局。其中,英特爾基礎(chǔ)設施處理器(IPU)定位與DPU類似,是一種可編程的網(wǎng)絡設備,可以管理存儲流量,減少時延,同時通過無磁盤服務器架構(gòu)有效利用存儲容量,能夠使云和通信服務提供商減少在CPU方面的開銷,充分釋放性能價值。AMD則在2022年以19億美元收購Pensando并正式進軍DPU領(lǐng)域,Pensando公司CEO和團隊加入AMD的數(shù)據(jù)中心解決方案部門。

“英特爾IPU從定位上來看要更高,直接把基礎(chǔ)設施作為DPU的定義其實是極其準確的。但是英特爾作為行業(yè)內(nèi)的‘大象’,專屬權(quán)力就是慢?!臂迟F海表示,雖然IPU定位很好、基礎(chǔ)也不錯,但是迭代非常慢,而AMD收購初創(chuàng)公司也有可能直接減慢其DPU項目發(fā)展?!皩︸S數(shù)來說,DPU的定義是集眾家之長,真正還原DPU之于整個計算系統(tǒng)的意義?!?/p>

DPU的功能和應用范圍都要多過傳統(tǒng)網(wǎng)卡

智算中心的多點全面鋪開也讓智能網(wǎng)卡或以太網(wǎng)物理芯片的需求,成為業(yè)內(nèi)眾多廠商的創(chuàng)新和產(chǎn)業(yè)化競爭的焦點。目前浪潮、新華三、博通等廠商均有相關(guān)布局。

DPU的產(chǎn)品概念和技術(shù)特點,也被直接拿來與智能網(wǎng)卡進行對比。究竟孰優(yōu)孰劣、是否會被取代,受到業(yè)內(nèi)的關(guān)注和討論。

面對爭議,鄢貴海接受采訪時認為,DPU不會被取代,其獨特優(yōu)勢反而會在未來的智算中心建設中迎來需求放量。

“所謂的智算中心網(wǎng)卡,其功能來說在智算中心中要解決的核心問題是GPU之間、GPU跟存儲之間的通信,但在解決GPU跟CPU路徑中的帶寬和數(shù)據(jù)流量的問題時沒有那么顯著。”鄢貴海表示,網(wǎng)卡主要解決網(wǎng)絡數(shù)據(jù)進入后通過PCIe設備接入主機的過程,并不會對高帶寬的要求進行特殊處理,這種情況下傳統(tǒng)網(wǎng)卡不太適用于未來智算中心的網(wǎng)絡接口卡位置。

在鄢貴海看來,DPU要支持類似于GBR、GBS的負載,其實就是給GPU之間、GPU和CPU之間的通信找到一條快速通路,這一通路要搭建在全新的網(wǎng)絡設備接口上,而全新的網(wǎng)絡接口就是DPU。因此,DPU的功能和應用范圍都要多過傳統(tǒng)網(wǎng)卡,“未來智算中心里面DPU用的量不僅不會少,還會越來越多?!?/p>

“當然,數(shù)據(jù)中心網(wǎng)絡結(jié)構(gòu)復雜,通常網(wǎng)絡不可能只有一套”。鄢貴海也表示,未來不同網(wǎng)絡可能要用不同的功能,比如運維、管控、監(jiān)控用傳統(tǒng)以太做,智算靠無損RDMA的網(wǎng)絡。“這種情況下,在智算中心中有用傳統(tǒng)網(wǎng)卡的需求,但是更大的需求、增長更快的需求,還是在高速網(wǎng)絡、高速的RDMA及無損網(wǎng)絡上?!?/p>

收藏
77.03W
我要評論
歡迎您發(fā)表有價值的評論,發(fā)布廣告和不和諧的評論都將會被刪除,您的賬號將禁止評論。
發(fā)表評論
要聞
股市
關(guān)聯(lián)話題
8.49W 人關(guān)注
1.08W 人關(guān)注
9354 人關(guān)注