廊坊新聞網-主流媒體,廊坊城市門戶

    騰訊云首次披露自研星脈高性能計算網絡

    2023-06-27 01:45:26 來源:北青網

    AIGC的爆發除了帶來算力上的挑戰,對網絡的要求也達到了前所未有的高度。6月26日,騰訊云首次對外完整披露自研星脈高性能計算網絡:星脈網絡具備業界最高的3.2T通信帶寬,能提升40%的GPU利用率,節省30%~60%的模型訓練成本,為AI大模型帶來10倍通信性能提升。基于騰訊云新一代算力集群HCC,可支持10萬卡的超大計算規模。

    AIGC的火爆帶來AI大模型參數量從億級到萬億級的飆升。為支撐海量數據的大規模訓練,大量服務器通過高速網絡組成算力集群,互聯互通,共同完成訓練任務。


    (資料圖)

    大集群不等于大算力,相反,GPU集群越大,產生的額外通信損耗越多。大帶寬、高利用率、信息無損,是AI大模型時代網絡面臨的核心挑戰。

    千億、萬億參數規模的大模型,訓練過程中通信占比最大可達50%,傳統低速網絡的帶寬遠遠無法支撐。同時,傳統網絡協議容易導致網絡擁塞、高延時和丟包,而僅0.1%的網絡丟包就可能導致50%的算力損失,最終造成算力資源的嚴重浪費。

    基于全面自研能力,騰訊云在交換機、通信協議、通信庫以及運營系統等方面,進行了軟硬一體的升級和創新,率先推出業界領先的大模型專屬高性能網絡——星脈網絡。

    在硬件方面,星脈網絡基于騰訊的網絡研發平臺,采用全自研設備構建互聯底座,實現自動化部署和配置。

    在軟件方面,騰訊云自研的TiTa網絡協議,采用先進的擁塞控制和管理技術,能夠實時監測并調整網絡擁塞,滿足大量服務器節點之間的通信需求,確保數據交換流暢、延時低,實現高負載下的零丟包,使集群通信效率達90%以上。

    此外,騰訊云還為星脈網絡設計了高性能集合通信庫TCCL,融入定制化解決方案,使系統實現了微秒級感知網絡質量。結合動態調度機制合理分配通信通道,可以避免因網絡問題導致的訓練中斷等問題,讓通信時延降低40%。

    網絡的可用性,也決定了整個集群的計算穩定性。為確保星脈網絡的高可用,騰訊云自研了端到端的全棧網絡運營系統,通過端網立體化監控與智能定位系統,將端網問題自動定界分析,讓整體故障的排查時間由天級降低至分鐘級。同時,大模型訓練系統的整體部署時間從19天縮減至4.5天。

    文/北京青年報記者 溫婧

    編輯/樊宏偉

    關鍵詞:

    亚洲综合久久1区2区3区| 久久亚洲成a人片| 亚洲精品国产品国语在线| 亚洲福利精品一区二区三区| 亚洲欧美国产精品专区久久| 亚洲伊人久久大香线蕉在观| 亚洲色图校园春色| 亚洲福利视频网址| 亚洲欧洲精品视频在线观看| 亚洲自偷精品视频自拍| 亚洲自偷自拍另类12p| 亚洲一区中文字幕久久| 亚洲人成网站在线播放影院在线 | 精品久久久久亚洲| 亚洲AV无码AV日韩AV网站| 亚洲aⅴ无码专区在线观看春色 | 国产亚洲国产bv网站在线| 亚洲一卡二卡三卡| 亚洲jjzzjjzz在线观看| 国产成人亚洲合集青青草原精品| 亚洲AV综合色区无码二区爱AV| 亚洲国产模特在线播放| 亚洲1234区乱码| 亚洲色最新高清av网站| 亚洲欧美日韩一区二区三区在线| 亚洲另类无码专区首页| 黑人粗长大战亚洲女2021国产精品成人免费视频 | 亚洲国产精品一区二区久久| 久久精品国产亚洲av日韩 | 亚洲AV成人一区二区三区观看| 亚洲av无码日韩av无码网站冲| 337p日本欧洲亚洲大胆人人| 国产精品亚洲色婷婷99久久精品| 99亚洲男女激情在线观看| 亚洲国产成人久久综合一区77| 亚洲伊人久久综合影院| 国产成人亚洲综合色影视 | 亚洲国产aⅴ成人精品无吗| 亚洲 小说区 图片区 都市| 国产午夜亚洲不卡| 亚洲AV无码成人网站久久精品大|