天堂а√在线最新版中文在线 I 臭脚猛1s民工调教奴粗口视频 I 九九热这里只有在线精品视 I 青青草国产在线播放 I 国产美女色诱视频又又酱 I 三级中文字幕 I 久久国产精品久久国产精品 I 欧美xxxxx高潮喷水 I 图片区小说区亚洲 I 在线中文字幕有码中文 I 成人在线观看免费视频 I 国产一区二区三区久久久 I 伦理片一区二区 I 开心丁香婷婷深爱五月 I 成人综合婷婷国产精品久久 I 色大师在线观看 I 天天爽人人爽 I 亚洲精品69 I 91影 I 欧美69式囗交 I 区一区二区三 I 日韩欧美亚洲综合久久 I 亚洲人成网站18禁止大app I 亚洲熟妇无码av不卡在线观看 I 一级特黄欧美 I 日韩不卡1卡2卡三卡2021精品推荐 I 麻豆福利视频导航 I www.亚洲欧美 I 久久538 I 久久久片 I 国产精品ww I 伊人色**天天综合婷婷 I 好男人资源在线www免费 I 国模冰漪150p私拍大胆 I 黄色高潮视频 I 美女视频免费在线观看 I 亚洲av日韩av不卡在线观看 I 柠檬福利第一导航在线 I 伊人久久大香线蕉 I 青青草原伊人 I www.日日 I 黄色国产精品 I 巨胸美乳无码人妻视频 I 校花扒腿让我c视频 I 韩国摩托摇 I 欧美超乳巨大肥奶 I 大地资源在线观看官网第三页 I 我要看一级黄色录像 I 欧美一区二区三区思思人 I 亚洲高清区 I 在线麻豆精东9制片厂av影现网 I 91av手机在线观看 I 天天操福利视频 I 欧美一级黄色录相 I 好吊视频一二三 I 亚洲精品va I 骚母返乡记最经典十句话

技術科普 | AI大模型中的RDMA網絡

時間:2025-05-29

什么是RDMA

  在介紹RDMA網絡之前,我們先來了解下什么是DMA 。DMA(Direct Memory Access)是一種允許外部IO設備直接訪問內存,而不需要通過CPU的技術。DMA技術可以顯著提高數據傳輸的效率和速度,因為它避免了CPU和Memory之間的數據拷貝,從而減少了CPU的負擔,并提高了數據傳輸的效率。RDMA(Remote Direct Memory Access )則是允許一臺服務器直接訪問其他服務器上的Memory 。在智算時代,RDMA技術被廣泛應用于大規模分布式訓練和推理場景中。


為什么要使用 RDMA

  隨著AI大模型的快速發展,模型參數量、數據量的不斷增加,單個GPU服務器已經難以滿足模型訓練和推理的算力資源要求,分布式多機多卡的訓練與推理已經成為必然。多機多卡的訓推場景對算力網絡提出了以下要求:

1. 高吞吐量:大模型參數量、數據量巨大,每一次訓練推理都是幾百G,甚至幾十T的數據量;

2. 低延遲:大模型訓練推理過程中,數據的傳輸延遲對訓練推理的效率影響很大,當網絡延遲成為瓶頸時,會導致GPU空閑等待數據傳輸完成,從而降低整體的訓練效率,進而造成算力的浪費;

3. 高可靠性 :大模型訓練推理過程中,數據的傳輸可靠性對訓練推理的效率影響很大,當網絡有丟包重傳時,會導致所有GPU閑置,同樣造成算力的巨大浪費。

  傳統以太網的設計和實現無法滿足以上要求,已經成為大模型訓推場景下算力集群的瓶頸。基于RDMA 技術的網絡從底層技術原理和設計實現上,滿足了高吞吐、低延遲、無丟包的要求,從而提升了算力集群的效率。


RDMA的網絡實現

在AI大模型訓推場景中使用 RMDA技術的網絡包括:

In?niband簡稱IB網絡;

RoCE(RDMA over Coveraged Ethernet)網絡


IB網絡

  IB網絡設計為無損網絡,在發送端會動態監測接收端的緩存能力,只有在接收端緩存區有足夠空間時,才會發送數據。這得益于其完全區別于傳統以太網的,自定義的4層網絡架構(物理層、鏈路層、網絡層、傳輸層)。在鏈路層集成了流控協議,保障發送端速率不會超出接收端的接收速率。傳輸層中創建的虛擬通道可直接被上層應用使用,不再需要通過操作系統協議棧。


1748484637481759.png


*圖片來源于IBTA(InfiniBand Trade Association )



  IB網絡的主要廠商是已經被英偉達收購的Mellanox公司,其擁有IB網絡的核心技術專利,占有全球將近90%的市場份額,是高性能計算集群的首選。IB網絡的優勢在于超低延遲,高吞吐,交付部署簡單,但需要專門的網卡和交換機支持。IB網絡的發展路線圖如下:

 

1748484722995763.png

*圖片來源于IBTA(InfiniBand Trade Association )


對應英偉達公司的產品線如下:

1748484782697251.png


RoCE網絡

  RoCE由IBTA(In?niBand Trade Association)制定,通過ECN和PFC實現流量控制,進而實現無損網絡。市場上很多網絡設備廠商都有提供相應的產品。特點是兼容現有以太網,成本相對較低,交付部署相對復雜。


Spectrum是英偉達公司的RoCE網絡交換機,其產品線如下:

1748484831318426.png

返回列表
安擎計算機信息股份有限公司
  • 服務熱線:
    售前—400-779-6858 售后—400-700-6909
  • 服務郵箱:
    support@enginetech.cn
  • 銷售郵箱:
    sales@enginetech.cn
公眾號
Copyright ? 2023 安擎計算機信息股份有限公司 版權所有 津ICP備17006743號 公網安備 12011402001065號
中央網信辦互聯網違法和不良信息舉報中心:https://www.12377.cn 天津市互聯網違法和不良信息舉報中心:tjjubao@tj.gov.cn https://www.qinglangtianjin.com
主站蜘蛛池模板: 虹口区| 麟游县| 都兰县| 禄劝| 灵丘县| 长沙县| 邵阳市| 莒南县| 白山市| 新丰县| 原平市| 浪卡子县| 溧阳市| 临沂市| 汤原县| 台东县| 堆龙德庆县| 临武县| 黔西县| 新宁县| 灵川县| 商洛市| 荔浦县| 吐鲁番市| 长顺县| 芦山县| 江陵县| 肃宁县| 正镶白旗| 万宁市| 阿拉善左旗| 沾化县| 铜梁县| 盖州市| 灵武市| 芮城县| 文化| 永寿县| 泰州市| 肇源县| 洛南县|