展會(huì)信息港展會(huì)大全

超以太網(wǎng)開放合作,關(guān)注5G通信板塊機(jī)會(huì)
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-04-24 14:18:31   瀏覽:7773次  

導(dǎo)讀:一、事件: 在AIGC等催化下智算需求激增,InfiniBand一直以零丟包的特點(diǎn)在AI訓(xùn)練中獨(dú)占鰲頭,配合英偉達(dá)GPU幾乎壟斷AI智算市...

一、事件:

在AIGC等催化下智算需求激增,InfiniBand一直以零丟包的特點(diǎn)在AI訓(xùn)練中獨(dú)占鰲頭,配合英偉達(dá)GPU幾乎壟斷AI智算市常

為抵抗這種市場(chǎng)擠壓,2023年AMD、Arista、博通、思科等聯(lián)合組織超以太聯(lián)盟正式成立,力在推動(dòng)行業(yè)格局變化。超以太網(wǎng)聯(lián)盟(UltraEthernetConsortium,UEC)旨在創(chuàng)建一個(gè)“基于以太網(wǎng)的完整通信堆棧架構(gòu)”,用超以太網(wǎng)傳輸協(xié)議取代基于以太網(wǎng)的RoCE協(xié)議,提高網(wǎng)絡(luò)吞吐量、降低延遲,增強(qiáng)網(wǎng)絡(luò)的可靠性和穩(wěn)定性,既保持了以太網(wǎng)的成本效益和普及性,又提供了超級(jí)計(jì)算互連所需的性能。

UEC集結(jié)了AMD、Arista、博通、思科等設(shè)備商和Meta、微軟等云廠商,國(guó)內(nèi)企業(yè)包括阿里云、百度、世紀(jì)互聯(lián)、字節(jié)跳動(dòng)、華為、新華三、光迅科技、騰訊、銳捷網(wǎng)絡(luò)等。

事件點(diǎn)評(píng):華夏基金認(rèn)為,以太網(wǎng)具備通用性和硬件部署經(jīng)濟(jì)性,在短期與InfiniBand有望形成抗衡,并隨著豐富生態(tài)中參與者的合作迭代,在長(zhǎng)期勝出;以太網(wǎng)生態(tài)中的頭部供應(yīng)商未來有望受益于AI催化下的硬件擴(kuò)容和以太網(wǎng)占有率提升的雙重利好因素。相關(guān)ETF方面,5G通信ETF(515050),其前十大持倉(cāng)股分別為立訊精密、中際旭創(chuàng)、工業(yè)富聯(lián)、中興通訊、紫光股份、兆易創(chuàng)新、新易盛、三安光電、天孚通信、滬電股份。

二、人工智能對(duì)網(wǎng)絡(luò)要求更高,催動(dòng)通信技術(shù)協(xié)議發(fā)展

智能計(jì)算對(duì)通信網(wǎng)絡(luò)的需求大幅提升。2017年Google發(fā)布《AttentionIsAllYouNeed》,成為后續(xù)大模型架構(gòu)基礎(chǔ),論文中提出的Transformer神經(jīng)網(wǎng)絡(luò)利用Self-attention自注意力機(jī)制實(shí)現(xiàn)并行處理。自此,人們意識(shí)到模型表現(xiàn)與其參數(shù)規(guī)模成正比,從Transformer的1億參數(shù)量到SwitchTransformer的1.6萬(wàn)億參數(shù)量,參數(shù)和訓(xùn)練集規(guī)模不斷刷新。大模型通過數(shù)據(jù)并行和模型并行輔助訓(xùn)練,計(jì)算節(jié)點(diǎn)較多,且節(jié)點(diǎn)之間需要高頻進(jìn)行中間計(jì)算結(jié)果的通信,為了提高GPU有效計(jì)算時(shí)間占比、避免網(wǎng)絡(luò)延遲和帶寬限制拖累AI訓(xùn)練效率,智算場(chǎng)景對(duì)通信性能提出了更高要求。

人工智能對(duì)通信網(wǎng)絡(luò)需求包括超大規(guī)模組網(wǎng)需求、超高帶寬需求、超低時(shí)延及抖動(dòng)需求、超高穩(wěn)定性需求、網(wǎng)絡(luò)自動(dòng)化部署需求。在人工智能大規(guī)模訓(xùn)練任務(wù)中,高效集群組網(wǎng)方案能夠提升AI分布式訓(xùn)練的效率,所以智能計(jì)算對(duì)通信網(wǎng)絡(luò)的規(guī)模、帶寬、時(shí)延、穩(wěn)定性和網(wǎng)絡(luò)部署提出高要求,相較于傳統(tǒng)的通用計(jì)算和超算有所提升。

三、InfiniBand和超以太簡(jiǎn)介

1.InfiniBand

InfiniBand是服務(wù)器硬件平臺(tái)的I/O標(biāo)準(zhǔn),通過交換機(jī)在節(jié)點(diǎn)間的點(diǎn)對(duì)點(diǎn)通道進(jìn)行數(shù)據(jù)傳輸,通道私有且受保護(hù)。InfiniBand擁有極高吞吐量和極低延遲,擴(kuò)展性好,最高能擴(kuò)展到具有數(shù)萬(wàn)個(gè)節(jié)點(diǎn)的集群。實(shí)際部署時(shí),需要使用一整套符合InfiniBand標(biāo)準(zhǔn)的硬件設(shè)備。InfiniBand多應(yīng)用于高性能計(jì)算集群、人工智能和超大規(guī);A(chǔ)設(shè)施,為大型企業(yè)或科研中心提供服務(wù)。

每一個(gè)InfiniBand體系結(jié)構(gòu)(InfiniBandArchitecture,即IBA)稱為子網(wǎng)(Subnet),每個(gè)子網(wǎng)內(nèi)最高可有65,536個(gè)節(jié)點(diǎn)(Node)。InfiniBand交換機(jī)用于子網(wǎng)范圍內(nèi),跨子網(wǎng)需要使用路由器或網(wǎng)關(guān)系統(tǒng)。每個(gè)節(jié)點(diǎn)通過網(wǎng)卡連接至子網(wǎng):使用主信號(hào)適配器(HCA)連接至CPU、內(nèi)存;通過目標(biāo)通道適配器(TCA)連接至I/O。

IBTA(InfiniBandTradeAssociation)于1999年成立,成立之初主要為了改良PCI總線升級(jí)慢、導(dǎo)致I/O性能限制系統(tǒng)發(fā)展的痛點(diǎn),主要成員包括Cray、Emulex、HP、IBM、Intel、Mellanox、Microsoft、Oracle、QLogic。InfiniBand推出之初,IBM、SUN、HP、Dell等多家企業(yè)發(fā)布InfiniBand相關(guān)產(chǎn)品,Cisco、QLogic等公司也相繼通過收購(gòu)進(jìn)入InfiniBand市常而在2003-2004年間,多家InfiniBand企業(yè)退出市場(chǎng),到2008年主要參與者僅剩Cisco、QLogic、Voltaire和Mellanox。后Cisco轉(zhuǎn)向FCoE(FibreChanneloverEthernet,以太網(wǎng)光纖通道)和10Gb以太網(wǎng);Intel收購(gòu)QLogic的InfiniBand交換機(jī)和適配器,后推出Omni-Path架構(gòu);Mellanox于2010年收購(gòu)Voltaire。由此,InfiniBand市場(chǎng)形成Mellanox一枝獨(dú)秀的局面。2019年,英偉達(dá)(Nvidia)公司豪擲69億美元,擊敗對(duì)手英特爾和微軟(分別出價(jià)60億和55億美元),成功收購(gòu)了Mellanox。

IB市場(chǎng)上,主要是Nvidia(收購(gòu)的Mellanox公司)和Intel(收購(gòu)的Qlogic公司)兩大玩家。IB雖然性能更好,但價(jià)格較貴。

2.超以太

以太網(wǎng)是目前全球應(yīng)用最廣泛的局域網(wǎng)技術(shù),由IEEE的802.3標(biāo)準(zhǔn)制定相關(guān)的技術(shù)標(biāo)準(zhǔn)。標(biāo)準(zhǔn)中包括了物理層的連接、電信號(hào)以及介質(zhì)訪問控制等內(nèi)容。除了IEEE標(biāo)準(zhǔn)組織,還有以太網(wǎng)技術(shù)聯(lián)盟(ETC)和超級(jí)以太網(wǎng)聯(lián)盟(UEC)等組織也會(huì)發(fā)布相關(guān)標(biāo)準(zhǔn)。憑借著高可靠性、低成本、易于管理以及高速等優(yōu)勢(shì),以太網(wǎng)技術(shù)廣泛應(yīng)用于自動(dòng)化、自動(dòng)駕駛、企業(yè)網(wǎng)和云計(jì)算等領(lǐng)域。

AMD等廠商共同組建超以太網(wǎng)聯(lián)盟(UltraEthernetConsortium,UEC),旨在創(chuàng)建一個(gè)“基于以太網(wǎng)的完整通信堆棧架構(gòu)”,用超以太網(wǎng)傳輸協(xié)議取代基于以太網(wǎng)的RoCE協(xié)議,提高網(wǎng)絡(luò)吞吐量、降低延遲,增強(qiáng)網(wǎng)絡(luò)的可靠性和穩(wěn)定性,既保持了以太網(wǎng)的成本效益和普及性,又提供了超級(jí)計(jì)算互連所需的性能。

UEC分別從物理層、鏈路層、傳輸層、軟件層四大方面改進(jìn)以太網(wǎng)技術(shù),近期又成立了存儲(chǔ)、管理、兼容性&測(cè)試、性能&調(diào)試工作組,剛剛展開工作。

UEC旨在用一種新的超以太傳輸協(xié)議替代現(xiàn)有的RoCE協(xié)議,致力于改造以太網(wǎng)上的RDMA操作來優(yōu)化AI和HPC工作負(fù)載。超以太傳輸協(xié)議和RoCE協(xié)議都屬于RDMA協(xié)議是當(dāng)今AI訓(xùn)練工作的基本組成部分,它允許CPU,GPU,TPU或其他加速器將數(shù)據(jù)直接從發(fā)送方的存儲(chǔ)器傳輸?shù)浇邮辗降拇鎯?chǔ)器。這種零拷貝方法可實(shí)現(xiàn)低延遲并避免操作系統(tǒng)開銷。RoCE主要被設(shè)計(jì)用于傳統(tǒng)數(shù)據(jù)中心環(huán)境,而UET協(xié)議支持多路徑、分組噴射傳輸和高效的速率控制算法,這些特性使得UET特別適合于AI和HPC工作負(fù)載,能夠?yàn)檫@些高負(fù)載應(yīng)用提供更好的網(wǎng)絡(luò)效能和效率,適用于高性能計(jì)算場(chǎng)景。此外在性能上向AI和HPC工作負(fù)載提供更加簡(jiǎn)單的的API,致力于提高網(wǎng)絡(luò)利用率和降低尾部延遲,有利于加速RDMA操作。

最后,UEC通過智能RDMA、網(wǎng)絡(luò)級(jí)負(fù)載均衡、優(yōu)先級(jí)流量控制(PFC)、iLossless智能算法、ACC(AutomaticECN)和全生命周期自動(dòng)管理等關(guān)鍵技術(shù)打造無損網(wǎng)絡(luò)架構(gòu),解決丟包和重傳問題,實(shí)現(xiàn)0丟包以太網(wǎng)。

3.InfiniBandVS.超以太

超以太與InfiniBand作為兩種用于AI和HPC領(lǐng)域的網(wǎng)絡(luò)通信技術(shù),各具特點(diǎn),適用于不同應(yīng)用場(chǎng)景。

在效應(yīng)上,超以太網(wǎng)注重解決大規(guī)模部署中的性能和效率問題,而InfiniBand可能因端點(diǎn)間的一對(duì)一關(guān)系限制網(wǎng)絡(luò)效率。目前,以太網(wǎng)和InfiniBand在支持大規(guī)模部署時(shí)都存在實(shí)際端點(diǎn)數(shù)量的限制,例如InfiniBand的尾延遲增加問題。

在生態(tài)上,超以太網(wǎng)以其開放標(biāo)準(zhǔn)促進(jìn)了廣泛的技術(shù)融合和不同制造商和設(shè)備間的聯(lián)合創(chuàng)新,采取開放的方式尋求未來AI與HPC解決方案,而InfiniBand則與NVIDIAGPU共同形成了一個(gè)封閉但優(yōu)化的性能高地。

在定位上,InfiniBand主要應(yīng)用于高性能計(jì)算,追求高速率和可靠性,有物理地址限制。而以太網(wǎng)在推出目的是兼容性,面向更多終端設(shè)備互聯(lián),目前在全世界范圍內(nèi)應(yīng)用廣泛。

在成本上,基于InfiniBand的網(wǎng)絡(luò)架構(gòu)硬件供應(yīng)商僅有英偉達(dá),生態(tài)較為封閉,英偉達(dá)議價(jià)能力強(qiáng);而基于以太網(wǎng)協(xié)議的網(wǎng)絡(luò)架構(gòu)有豐富的硬件供應(yīng)商,下游客戶采購(gòu)時(shí)選擇多,成本可控。

四、投資觀點(diǎn)

UEC將以新形式進(jìn)行傳輸層處理,在非無損網(wǎng)絡(luò)的情況下也可實(shí)現(xiàn)以太網(wǎng)性能提升,較RDMA更靈活。基于UEC提供的功能,以太網(wǎng)將不會(huì)發(fā)生隊(duì)頭阻塞,可實(shí)現(xiàn)以最小的丟包控制到目標(biāo)主機(jī)最終鏈路上的扇入,并能減少消息延遲,無需針對(duì)網(wǎng)絡(luò)和工作負(fù)載調(diào)整擁塞算法參數(shù),網(wǎng)絡(luò)擴(kuò)展性強(qiáng),支持1,000,000個(gè)端點(diǎn)。華夏基金表示,UEC傳輸協(xié)議未來有望超越RoCE協(xié)議,力爭(zhēng)對(duì)標(biāo)InfiniBand性能,實(shí)現(xiàn)以太網(wǎng)在智算領(lǐng)域滲透率的提升。

UEC成立進(jìn)一步增強(qiáng)網(wǎng)絡(luò)設(shè)備端對(duì)AI和HPC大規(guī)模部署的靈活性,開放的生態(tài)與環(huán)境也有望催化對(duì)于解耦等需求較多的客戶選擇相應(yīng)的解決方案,UEC成立進(jìn)一步增強(qiáng)網(wǎng)絡(luò)設(shè)備端對(duì)AI和HPC大規(guī)模部署的靈活性,開放的生態(tài)與環(huán)境有望催化對(duì)于解耦等需求較多的客戶選擇相應(yīng)的解決方案。超以太聯(lián)盟相關(guān)企業(yè)及網(wǎng)絡(luò)側(cè)交換機(jī)與光模塊相關(guān)企業(yè)也有望受益。

相關(guān)產(chǎn)品:

5G通信ETF(515050)及其聯(lián)接基金(008086/008087),指數(shù)成分股在光通信、光模塊主題的暴露超30%,5G通信ETF跟蹤中證5G通信主題指數(shù),選取產(chǎn)品和業(yè)務(wù)與5G通信技術(shù)相關(guān)的上市公司股票作為樣本股,捕捉通信技術(shù)革新帶來的機(jī)遇。

人工智能AIETF(515070)及其聯(lián)接基金(008585/008586):中證人工智能主題指數(shù)(指數(shù)代碼:930713.CSI,指數(shù)簡(jiǎn)稱:CS人工智)選取為人工智能提供基礎(chǔ)資源、技術(shù)以及應(yīng)用支持的公司中選取代表性公司作為樣本股,反映人工智能主題公司的整體表現(xiàn)。該指數(shù)已納入截至2018年9月30日的IOSCO金融基準(zhǔn)原則鑒證報(bào)告范圍。

云計(jì)算50ETF(516630)及其聯(lián)接基金(019868/019869):中證云計(jì)算與大數(shù)據(jù)主題指數(shù)(指數(shù)代碼:930851.CSI,指數(shù)簡(jiǎn)稱:云計(jì)算指數(shù))選取50只業(yè)務(wù)涉及提供云計(jì)算服務(wù)、大數(shù)據(jù)服務(wù)以及上述服務(wù)相關(guān)硬件設(shè)備的上市公司A股作為樣本股,以反映云計(jì)算與大數(shù)據(jù)主題股票的整體表現(xiàn)。

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港