本站真誠介紹香港這個「東方之珠」和「亞洲國際都會」

亞洲國際都會 asiasworldcity

以太網和InfiniBand外,第三種選擇

(本文内容不代表本站观点。)
香港飛龍 Hong Kong HK Dragon
第4代「香港飛龍」標誌

本文内容:

公衆號記得加星標??,第一時間看推送不會錯過。來源:內容編譯自IEEE。在過去的美好時光裏,網絡只是連接少量本地計算機。但時代變了。在人工智能主導的世界裏,關鍵在於協調數萬臺服務器的活動,以訓練大型語言模型,並且不造成任何通信延遲。現在,有一箇經過優化的架構可以實現這一點。Cornelis Networks表示,其 CN500 網絡結構可最大限度地提高人工智能性能,支持部署多達 50 萬臺計算機或處理器(比現在高出一箇數量級),並且不會增加延遲。繼以太網和InfiniBand之後,這項新技術爲網絡領域帶來了第三款重要產品。它旨在使人工智能和高性能計算機(HPC,即超級計算機)能夠以更高的效率實現更快、更可預測的完成時間。Cornelis 聲稱,在 HPC 方面,其技術優於2022 年推出的InfiniBand NDR版本,每秒傳遞的消息數量是後者的兩倍,延遲降低了 35%。在人工智能應用方面,與基於以太網的協議相比,其通信速度提高了六倍。以太網長期以來一直是局域網(LAN)的代名詞。軟件補丁使其通信協議經受住了時間的考驗。InfiniBand 的發明是一項改進,但它的設計目標仍然是相同的:連接少量本地設備。“這些技術發明之初,與並行計算毫無關聯,”賓夕法尼亞州 Cornelis 公司聯合創始人、總裁兼首席運營官Philip Murphy表示。當數據中心開始興起時,工程師們需要一種新的網絡解決方案。由於不同的系統使用不同的軟件,它們無法共享資源——因此,擴展以太網和 InfiniBand 等網絡以適應最繁忙的運營時段顯得頗具挑戰性。“這引發了整個雲計算的演變,”墨菲說道。在不同的計算機甚至不同的組織之間共享基於雲的 CPU 成爲了當時流行的解決方案。然而,儘管數據中心先驅們試圖最大限度地增加單臺服務器上運行的應用程序數量,墨菲和他的同事們卻看到了相反方法的價值:最大限度地增加單個應用程序上運行的處理器數量。“這需要一箇完全不同的網絡解決方案,”他說道,而這正是 Cornelis 現在提供的。該公司的Omni-Path架構由英特爾開發,用於超級計算應用,例如模擬氣候模型或藥物設計的分子相互作用,它提供了最大的吞吐量,並且零數據包丟失。無擁堵數據高速公路協調處理器來訓練人工智能模型需要以極高的帶寬交換大量消息(數據包)。每毫秒的消息速率很重要,延遲(即接收方需要多長時間才能做出響應)也很重要。在整個網絡中共享如此多的數據包所帶來的一箇主要挑戰是流量擁堵。墨菲解釋說,你需要一種可靠地繞過擁堵點並避免其他問題的方法。例如,如果數據包通過不同的路由到達同一目的地,它們可能會出現亂序。Cornelis 的動態自適應路由算法通過繞過短暫擁塞事件來緩解擁塞,而其擁塞控制架構則將流量路由到“熱門”目的地。“如果某個體育場舉辦了一場我們都想去的活動,你肯定不希望經過體育場的流量也卡在那裏,”Murphy 說。中央調速技術實現了這種擁塞控制架構。交換機會檢測流量的形成位置,然後指示發送方減速,直到擁塞消散。“想象一下,當車輛駛入高速公路入口匝道時,如何緩解交通擁堵,”Murphy 解釋道。另一箇挑戰是避免延遲。在傳統的以太網架構中,發送數據包需要端點有足夠的內存。“如果我發送給你,而你的內存不足,你必須回來告訴我,”墨菲說。這是一箇漫長的循環,需要大量的不可擴展的緩衝區。相反,科內利斯使用了一種名爲“基於信用的流量控制”的算法,可以提前分配內存。“你什麼都不用告訴我,我就能知道還能發送多少,”墨菲說。最後,系統避免了 GPU 或鏈路故障導致的宕機。在傳統架構中,如果服務器宕機,應用程序也會宕機。修復這個問題需要從最近的檢查點重新啓動——這本身就需要大量的計算能力來創建。“想象一下,如果每次點擊文檔上的‘保存’,你都必須等待 20 分鐘,”Murphy 說。相反,由於 Cornelis Networks 的服務器分佈在多臺計算機上,因此即使帶寬略低,應用程序也能保持運行,直到故障鏈路被替換——無需檢查點。高效的人工智能從物理上講,CN5000產品是一款基於定製芯片構建的網卡。這些網卡可以插入每臺服務器,“就像你在家裏的電腦上插以太網卡一樣,”Murphy 解釋道。機架頂部交換機通過線纜連接到每臺服務器和其他交換機,而導向器級交換機則配備 48 或 576 個端口,用於連接機架交換機。“每臺服務器都插有網卡,因此你可以構建數千個端點集羣,”Murphy 說。該公司的主要市場是那些希望升級到新集羣以實現 AI 或更快 HPC 模擬的組織。Cornelis 會通過與其合作的三家服務器和網絡交換機原始設備製造商之一來實現這一目標。OEM 會從 Cornelis 購買物理卡,並將其插入服務器,然後再完成訂單。直到最近,訓練一箇神經網絡模型還是一次性的事情。但現在,訓練一箇擁有數萬億參數的人工智能模型意味着需要反覆進行微調或更新。Cornelis 希望能夠利用這一點。“如果你不採用人工智能,你就會倒閉。如果你使用人工智能效率低下,你仍然會倒閉,”Murphy 說。“我們的客戶希望以儘可能最高效的方式採用人工智能。”Nvidia 在數據中心以太網銷售額上超越思科和競爭對手 Arista以太網業務並非單一的,而是多種多樣的。如今,隨着用於後端AI集羣網絡的以太網交換機的演進,出現了一種新的業務,有可能主導收入和利潤。這四大以太網細分市場——園區、邊緣、數據中心前端和數據中心後端——並非步調一致,儘管它們之間的協議兼容,但基本上各行其是。例如,不管你信不信,根據 IDC 的研究,1Gb/秒交換機市場在今年第一季度實際上實現了增長,而該市場仍然佔據數據中心以外以太網產品銷售收入的一半以上。第一代以太網交換機遵循在互聯網泡沫鼎盛時期最終確定的光纖和銅線協議傳輸標準,於2000年問世,而1 Gb/秒以太網則花了幾年時間纔在數據中心和運營商網絡中成爲主流,並最終進入園區網絡。因此,如果我們對IDC近期以太網市場公開聲明中的解讀和估計準確無誤,那麼在800 Gb/秒以太網交換機的銷售在大約25年後開始在數據中心獲得實質性增長的情況下,1 Gb/秒交換機在2025年第一季度仍能帶來約25億美元的銷售額,這或許會令人感到驚訝。另一方面,IDC 在其以太網交換和路由市場數據中首次公佈了 800 Gb/秒產品的銷售額。具體來說,如果 IDC 過去的表現可以作爲其當前表現的參考,我們懷疑它是否會再次這樣做。該公司表示,800 Gb/秒設備在第一季度帶來了 3.501 億美元的收入,佔同期全球 117 億美元以太網交換機總銷售額的 5.1%。200 Gb/秒和400 Gb/秒設備的銷售額增長了2.9倍,這些設備完全在數據中心銷售,有時也用於路由設備和交換工作。根據IDC過去的聲明以及我們據此構建的模型,我們認爲200 Gb/秒和400 Gb/秒設備合計創造了約45億美元的銷售額,本季度端口數量可能超過1800萬個。IDC對100 Gb/秒以太網的銷售額隻字未提。100 Gb/秒以太網即使在銷售十五年後仍用於高端園區市場以及企業和服務提供商網絡。10 Gb/秒設備的銷售額則在2023年開始批量出貨。我們的最佳預測是,100 Gb/秒以太網在第一季度創造了約30億美元的收入,而10 Gb/秒交換機的銷售額可能達到5億美元以上。校園和邊緣的 2.5 Gb/秒、5 Gb/秒、25 Gb/秒和 50 Gb/秒設備的銷售佔據了剩餘的大部分。路由器市場發展緩慢,路由工作量隨着時間的推移基本保持穩定,即使部分路由工作被轉移到也能承擔路由任務的現代交換機上——這在超大規模企業、雲構建商和能夠自行設計硬件和路由軟件堆棧的電信運營商中很常見。其他服務提供商的規模不足以承擔這樣的任務,這就是爲什麼思科和華爲技術公司仍然擁有路由硬件業務的原因。IDC 還在其剛剛發佈的 2025 年第一季度報告中開始單獨跟蹤 Nvidia。當然,Nvidia 已迅速崛起,在數據中心領域挑戰思科系統和 Arista Networks,這主要是因爲其 InfiniBand 超級計算互連在後端 AI 網絡方面的應用正在減弱,而其 Spectrum-X 以太網(具有與 BlueField DPU 配合使用的現代擁塞控制和自適應路由功能)正越來越多地被其 AI 系統客戶所採用。對於運行機密工作負載的能力級機器,HPC 中心對 Spectrum-X 的熱情程度還有待觀察。但對於那些運行能力級 HPC 系統且擁有數千名用戶運行各種相對較小的作業的人來說,我們認爲 Spectrum-X 所需的溢價可能是值得的,因爲 Spectrum-X 具有接近 InfiniBand 的網絡性能以及與共享雲實用程序相當的網絡微分段和安全性。我們對 Nvidia 以太網交換機的銷量有自己的估計,但在下面的圖表中,我們通過計算上圖中 Nvidia 的像素來確定 IDC 認爲的銷量。如你所見,Nvidia 絕對是以太網交換領域的有力競爭者,而且其崛起速度遠超 Arista Networks。Arista Networks 於 2009 年憑藉 10 Gb/秒的設備起步,並在 100 Gb/秒時代真正嶄露頭角。(Arista 最近才擴展到園區交換領域,如今在這個領域與思科競爭比十五年前在數據中心領域與思科競爭更加艱難。)本季度,思科的以太網交換機收入增長了4.7%,達到36.4億美元,佔以太網市場份額略低於三分之一。相比之下,英偉達的以太網交換機收入同比增長了8.6倍,環比增長了1.84倍。如果我們進行三角計算,就會發現英偉達在第一季度的以太網交換機銷售額爲14.6億美元,在117億美元的以太網交換機市場份額中佔據了12.5%的份額。而Arista Networks長期以來一直佔據着以太網交換機市場份額的榜首,其收入增長了27.1%,達到16.3億美元,佔市場份額的13.9%。惠普企業(HPE)的以太網交換機銷售額略高於410億美元,下降了5%,這主要得益於其Aruba無線網絡業務。華爲的銷售額爲7.04億美元,同比增長15.4%,不到2024年第四季度銷售額的一半。傳統上,第一季度對華爲來說是一箇非常疲軟的季度。根據IDC的數據以及我們構建模型時已知的信息,全球原始設計製造商(ODM)——主要銷售數據中心產品——共計貢獻了14.1億美元的銷售額,同比增長67.5%,環比增長18.6%。至於我們,關心的是當談到切換時,世界各地的數據中心內發生的情況。據IDC數據顯示,數據中心以太網交換機銷售額增長54.6%,達到69.2億美元,佔總銷售額的59.1%。在2020年第一季度至2022年第四季度(GenAI熱潮開始之時),數據中心以太網交換機銷售額佔整個市場的平均份額爲43.5%,因此,數據中心以太網支出出現了大幅增長,這完全歸功於用於訓練和推理的AI集羣。非數據中心市場部分(即園區和邊緣計算)的銷售額達到47.8億美元,同比增長9.5%。正如我們上文所述,其中略多於一半的銷售額來自園區領域銷售的1 Gb/秒設備。在上圖中,紅線標示了IDC停止公佈全球數據中心和非數據中心出貨量端口數量的點。我們已經盡力估算了這些數字,但必須承認,我們的估算是基於一箇較爲簡單的框架。讓我們更深入地研究一下數據中心。以下是過去五個季度的數據,這次英偉達從“其他”類別中被剔除,而 H3C 和瞻博網絡則重新被歸入“其他”類別,這意味着我們再也看不到它們了,因爲 IDC 只公開討論排名前五的廠商以及 ODM 廠商。請看下圖:如果剔除校園和邊緣計算,那麼 Nvidia 將緊隨 Arista Networks 之後,後者自 2023 年第四季度以來一直是數據中心以太網交換機的最大銷售商。2025年第一季度,Arista Networks 數據中心以太網交換機銷售額達14.8億美元,同比增長26.4%,佔據數據中心業務21.3%的份額。Nvidia 緊隨其後,銷售額達14.6億美元,市場份額達21.1%,其迅猛增長的勢頭在本文開篇有所提及。思科在數據中心領域位居第三,以太網設備銷售額達12.5億美元,在我們的模型中同比增長17.7%。正如我們之前提到的,ODM(原始設計製造商)銷售額增長了67.5%,達到14.1億美元,但同樣,該領域仍有十幾家公司在生產規模可觀的網絡設備。以下是數據中心以太網銷售的更長趨勢線,供您參考:所以問題是:您認爲 Arista Networks 能在數據中心領域超越 Nvidia 嗎?如果 Nvidia 試圖將其 Spectrum-X 網絡的銷售額與其當前的 Grace-Blackwell 和未來的 Vera-Rubin 機架式系統的銷售額直接掛鉤,它可能會發現自己陷入了反壟斷的困境。捆綁銷售是絕對不允許的,尤其是在一家公司擁有 85% 或更高的市場份額,並且相關市場(在本例中爲人工智能系統)定義嚴格的情況下。HPE 已經對美國和歐洲的超級計算實驗室進行了一定程度的施壓,迫使它們在其百億億次級和百億億次級機器中採用“Rosetta” Slingshot 互連技術,但購買這些機器的政府知道,爲了市場的長期利益,HPE 需要資金來投資於適合高性能計算 (HPC) 的以太網變體。利潤豐厚的 Nvidia 很難說服任何反壟斷機構相信它沒有捆綁銷售,即使它實際上沒有捆綁銷售。因此,即使 Nvidia 可能並非如此,也必須表現出開放的態度。正因如此,Nvidia 才與思科合作開發 Spectrum-X 互連產品,並同意將其 NX-OS 網絡操作系統移植到 Spectrum-4 及更高版本的 ASIC 上。Arista 是否會與 Nvidia 在交換機 ASIC 上建立類似的合作關係,這值得關注——考慮到 Arista 和思科過去的法律糾紛和普遍的敵意,雙方合作前恐怕難有進展。只需再進行一兩筆大型 AI 訓練和推理交易,Nvidia 就能遠遠超越 Arista。我們認爲,今年實現這一目標的可能性非常高。即便如此,Arista 及其 ASIC 合作伙伴博通也並未就此止步。https://spectrum.ieee.org/ai-network-architecturehttps://www.nextplatform.com/2025/06/23/nvidia-passes-cisco-and-rivals-arista-in-datacenter-ethernet-sales/*免責聲明:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅爲了傳達一種不同的觀點,不代表半導體行業觀察對該觀點贊同或支持,如果有任何異議,歡迎聯繫半導體行業觀察。今天是《半導體行業觀察》爲您分享的第4074期內容,歡迎關注。加星標??第一時間看推送,小號防走丟求推薦


(本文内容不代表本站观点。)
---------------------------------
本网站以及域名有仲裁协议(arbitration agreement)。

依据《伯尔尼公约》、香港、中国内地的法律规定,本站对部分文章享有对应的版权。

本站真诚介绍香港这个「东方之珠」和「亚洲国际都会」,香港和「东方之珠」和「亚洲国际都会」是本站的业务地点名称。

本网站是"非商业"(non-commercial),没有涉及商业利益或竞争。


2025-Jun-24 06:35pm (UTC +8)
栏目列表