首页 > 资讯 > 正文

腾讯发布新一代超强算力集群：面向大模型训练，性能提升3倍

来源：IT之家 2023-04-14 18:17:39

IT之家 4 月 14 日消息，IT之家从腾讯官方获悉，腾讯云发布了新一代 HCC 高性能计算集群，采用最新一代星星海自研服务器，搭载英伟达 H800 Tensor Core GPU。

(相关资料图)

腾讯官方称，该集群基于自研网络、存储架构，带来 3.2T 超高互联带宽、TB 级吞吐能力和千万级 IOPS。实测结果显示，新一代集群算力性能较前代提升 3 倍。

去年 10 月，腾讯完成首个万亿参数的 AI 大模型 —— 混元 NLP 大模型训练。在同等数据集下，将训练时间由 50 天缩短到 11 天。如果基于新一代集群，训练时间将进一步缩短至 4 天。

计算层面，服务器单机性能是集群算力的基础，腾讯云新一代集群的单 GPU 卡在不同精度下，支持输出最高 1979 TFlops 的算力。

针对大模型场景，星星海自研服务器采用 6U 超高密度设计，相较行业可支持的上架密度提高 30%；利用并行计算理念，通过 CPU 和 GPU 节点的一体化设计，将单点算力性能提升至更高。

网络层面，计算节点间，存在着海量的数据交互需求。随着集群规模扩大，通信性能会直接影响训练效率，需要实现网络和计算节点的最大协同。

腾讯自研的星脉高性能计算网络，号称具备业界最高的 3.2T RDMA 通信带宽。实测结果显示，搭载同等数量的 GPU，3.2T 星脉网络相较 1.6T 网络，集群整体算力提升 20%。

同时，腾讯自研的高性能集合通信库 TCCL，融入定制设计的解决方案。相对业界开源集合通信库，为大模型训练优化 40% 负载性能，消除多个网络原因导致的训练中断问题。

存储层面，大模型训练中，大量计算节点会同时读取一批数据集，需要尽可能缩短数据加载时长，避免计算节点产生等待。

腾讯云自研的存储架构，具备 TB 级吞吐能力和千万级 IOPS，支持不同场景下对存储的需求。COS+GooseFS 对象存储方案和 CFS Turbo 高性能文件存储方案，充分满足大模型场景下高性能、大吞吐和海量存储要求。

此外，新一代集群集成了腾讯云自研的 TACO 训练加速引擎，对网络协议、通信策略、AI 框架、模型编译进行大量系统级优化，大幅节约训练调优和算力成本。

腾讯混元大模型背后的训练框架 AngelPTM，也已通过腾讯云 TACO 提供服务，帮助企业加速大模型落地。

通过腾讯云 TI 平台的大模型能力和工具箱，企业可结合产业场景数据进行精调训练，提升生产效率、快速创建和部署 AI 应用。

依托分布式云原生的治理能力，腾讯云智算平台提供 16 EFLOPS 的浮点算力。

标签：

编辑：

“连接”与“计算”——从物联网迈向智联网星辰大海的两大门槛

2023-04-14 18:16:02

在物联网繁荣发展并向智联网迈进的关键阶段，对于“连接”与“计算”都提出了更高要求。模组作为重要的中间件，不仅需要跟随通信代际更迭而推

腾讯发布新一代超强算力集群：面向大模型训练，性能提升3倍

2023-04-14 18:17:39

IT之家4月14日消息，IT之家从腾讯官方获悉，腾讯云发布了新一代HCC高性能计算集群，采用最新一代星星海自研服务器，搭载英伟达H800Tens

亚马逊宣布ChatGPT竞品Bedrock，邀请10万客户参与体验世界热点

2023-04-14 18:19:59

IT之家4月14日消息，亚马逊经过数月的沉默之后，于今天正式推出了生成式AI产品Bedrock。它将和OpenAI的ChatGPT、微软的必

五指山消防联合辖区派出所开展娱乐场所消防安全检查|焦点快报

2023-04-14 18:02:03

海南网台、视听海南客户端4月14日消息（记者李祺通讯员岑冬梅）为做好近期消防安保工作，进一步消除公共娱乐场所消防安全隐患，有效预防和遏制

电脑开机密码忘了怎么进入系统_电脑开机密码

2023-04-14 18:05:35

1、【问题描述】：如何设置开机密码【原因分析】：无【简易步骤】：点击【开始】—【控制面板】—【用户账户】—【创建密码】—输入密码—【创

世界速递！d盘无法格式化一直提示被占用_d盘无法格式化

2023-04-14 18:17:22

1、【问题描述】：U盘无法格式化【原因分析】：磁盘无法格式化可以尝试在安全模式下或者使用【diskgenius】等转工具进行格式化。2、【风险提示

GW级产线开工钙钛矿量产时代要来了？是“虚火” 还是新一轮光伏革命？

2023-04-14 17:29:17

【GW级产线开工钙钛矿量产时代要来了？是“虚火”还是新一轮光伏革命？】4月12日，极电光能宣布计划建设全球首条1GW钙钛矿光伏生产线，这也是

国家能源局：3月份全社会用电量同比增长5.9%|全球热门

2023-04-14 17:16:51

【国家能源局：3月份全社会用电量同比增长5 9%】3月份，全社会用电量7369亿千瓦时，同比增长5 9%。分产业看，第一产业用电量92亿千瓦时，同比

因制动盘螺栓断裂英伦凯旋召回摩托车微头条

2023-04-14 17:27:54

日前，英轮凯旋（上海）商贸有限公司根据《缺陷汽车产品召回管理条例》和《缺陷汽车产品召回管理条例实施办法》的要求，向国家市场监督管理总

因后备厢进水等隐患奔驰召回GLE/GLS/M级|当前速看

2023-04-14 17:28:07

日前，梅赛德斯-奔驰（中国）汽车销售有限公司根据《缺陷汽车产品召回管理条例》和《缺陷汽车产品召回管理条例实施办法》的要求，向国家市场监

家电中的常见传感器应用

2023-04-14 17:15:42

传感器技术在我们的生活中已经常见到什么地步呢，就是我们日常使用的很多家电中都是有传感器的使用，下面就一起来看看这些家电中的常见传感器

智慧照明的一些常见应用场景-世界今日讯

2023-04-14 17:17:04

智慧照明的存在使我们在使用灯光的时候更加便利，而智慧照明不单单是存在于我们的家庭当中，还在很多的其他地方都有使用，下面就一起来看看。1

最高检发布未成年人检察社会支持体系示范建设典型案例

2023-04-14 17:06:37

未成年人检察社会支持体系示范建设典型案例案例一：段某某寻衅滋事附条件不起诉案——拓展社会支持资源开展精准帮教和家庭教育指

百度云管家切换账号方法介绍百度网盘怎么关联账号？

2023-04-14 17:00:19

百度云管家切换账号方法介绍1、首先：双击打开百度云管家。2、打开后会自动登录最近使用人的账号，我们点击右上方的三角形图标。3、选择【

芒果TV自动续费关闭教程是什么？芒果TV怎么赠送会员给好友？

2023-04-14 16:59:51

芒果TV自动续费关闭教程是什么？方法一：支付宝端设置方法1、首先我们打开支付宝APP，点击右下角的我的。2、在点击头像-设置-安全设置-安全

热图推荐

GW级产线开工钙钛矿量产时代要来了？是“虚火” 还是新一轮光伏革命？

国家能源局：3月份全社会用电量同比增长5.9%|全球热门

因制动盘螺栓断裂英伦凯旋召回摩托车微头条

因后备厢进水等隐患奔驰召回GLE/GLS/M级|当前速看

创世纪

叶子猪模拟器下载文件保存路径介绍叶子猪手游模拟器玩游戏卡怎么办？

叶子猪模拟器音量调节方法是什么？ mumu模拟器怎么设置按键？

暴风影音加速播放教程是什么？暴风影音如何多开视频窗口播放？

MuMu模拟器相机权限获取方法是什么？雷电模拟器怎么连接电脑摄像头？

网易MuMu模拟器调整分辨率教程是什么？雷电模拟器怎么开启固定窗口大小？

445端口开启方法是什么？软件端口打开失败怎么解决？

通信

热点

2023年4月8日（上海）——黑马原力在上海徐汇滨江进行了品牌全球首发。品牌首款MPS产品G60小黑在发布会现场以自动驾驶的方式闪亮登场，点燃

详细>>

CB-FH52是爱普生推出的3LCD商务投影机。作为新一代的商务投影机，CB-FH52具有高达4000流明的色彩亮度，投屏画面明亮清晰、色彩鲜艳，一经推

详细>>

2023年2月16日，由流媒体网、易目唯文化主办，黑龙江龙网视传媒有限公司协办的第七届金屏奖暨2022年度中国智能视听与科技创新产业盛典在哈

详细>>

2月14日,首届华彩杯算力基础设施应用创新大赛(以下简称大赛)在京正式启动。中国工程院邬贺铨院士、张宏科院士,工信部信息通信发展司一级巡

详细>>

2023年1月13日，2022（第六届）中国行业数字化年度风云榜（以下简称2022风云榜）评选结果正式发布。本届风云榜由信息化观察网组织发起，以5

详细>>

每年过年，必不可少的项目之一，就是发红包。一封封烫金封口、漂亮厚实的红包，带着一句句恭喜发财的欢乐祝福，浓浓的年味瞬间扑面而来。在

详细>>

腾讯发布新一代超强算力集群：面向大模型训练，性能提升3倍

热图推荐

创世纪

通信

最近更新

热点