CNTXJ.NET | 通信界-中国通信门户 | 通信圈 | 通信家 | 下载吧 | 说吧 | 人物 | 前瞻 | 智慧(区块链 | AI
 国际新闻 | 国内新闻 | 运营动态 | 市场动态 | 信息安全 | 通信电源 | 网络融合 | 通信测试 | 通信终端 | 通信政策
 专网通信 | 交换技术 | 视频通信 | 接入技术 | 无线通信 | 通信线缆 | 互联网络 | 数据通信 | 通信视界 | 通信前沿
 智能电网 | 虚拟现实 | 人工智能 | 自动化 | 光通信 | IT | 6G | 烽火 | FTTH | IPTV | NGN | 知本院 | 通信会展
您现在的位置: 通信界 >> 智慧 >> 新闻正文
 
突破五大制约因素:智算中心如何提高利用率
[ 通信界 | 赵妍 | www.cntxj.net | 2024/11/21 9:05:40 ]
 

智算中心作为AI时代必备的算力基础设施,正承载着AI繁荣发展的数据运算需求。在智算中心建设如火如荼之际,如何提升智算中心利用率,成为亟待解决的问题。

智算中心利用率待提升

智算中心通过算力生产、聚合、调度和释放,面向政府、企业、高校和科研机构等提供普惠公共算力服务。智算中心在建设和运营过程中,面临算力使用率不高、算力结构不合理、应用生态不完善、运营模式不成熟等诸多问题。其中,算力使用率不高是智算中心面临的主要问题之一。

浪潮信息AI和HPC产品线总经理刘军表示,智算中心建设初期,由于应用生态不完善,算力规模与用户需求不匹配,导致算力空闲率较高。据浪潮人工智能研究院测算,我国智算中心平均算力使用率为30%左右,远低于大型数据中心的50%~60%的水平。

影响算力利用率的五大因素

算力利用率涉及软硬件、网络、训练策略及算力调度等多个层面。根据中国信通院发布的《智算基础设施发展研究报告(2024年)》,影响算力利用率的关键因素包括芯片存储量、算力损耗、“通信墙”即多卡互联与多机互联时面临的通信瓶颈等。

2024-11-19_141212.jpg

硬件配置方面,使用高性能计算节点,如专业的AI芯片或高端GPU,以确保单节点的计算能力最大化。同时,根据AI训推任务的需求,合理配置服务器的内存、存储和I/O性能。英伟达中国区技术总监表示,“GPU的算力利用率受到内存带宽和访存效率的影响。通过引入高带宽内存(HBM)和优化内存访问模式,可以显著提升GPU的计算效率。”

软件与算法方面,AI训练需匹配更高效的深度学习框架,另外,还要对算法进行并行化处理,以充分利用多核处理器及多GPU优势。华为相关人员表示,“当前算力利用率不足的问题,很大程度上源于软件层面的瓶颈。通过优化编译器、运行时的环境,以及算法本身,可以显著提高算力资源的使用效率。”

网络性能方面,在构建高性能计算集群时,选择合适的网络架构至关重要。有数据表明,网络的丢包率达到1%时,智算中心集群中的GPU利用率就会在原有基础之上下降 50%。目前一些智算集群就采用了高效的InfiniBand、RoCE网络,以充分满足AI大规模并行计算要求。阿里巴巴达摩院相关负责人表示, “在大规模分布式计算中,通信延迟是一个重要的瓶颈。基于RDMA的高速互联技术,以减少节点间的通信开销,从而提升整体算力利用率。”

在AI训练策略上,采用数据、模型或流水线并行等分布式训练方式,并采用更高效的资源管理与调度器,利用缓存机制及训前预热策略,通过调整及优化超参数等措施,也可以显著提升算力集群的性能和效率。微软亚洲研究院研究员表示,“模型训练过程中的算力利用率往往受到数据预处理和批量大小的影响。通过合理的数据预处理和动态调整批量大小,可以有效提高模型训练的效率。”

算力调度也是影响算力利用率的因素。腾讯云副总裁刘杉表示,提高算力利用率的关键在于精细化的资源管理。智能调度系统,可以根据任务特性和实时负载情况,动态调整资源分配,确保每个任务都能获得最佳的执行环境。” 清华大学计算机系教授陈文光表示,在大规模并行计算中,任务调度和负载均衡是非常重要的。

四大举措提升算力利用率

针对智算中心利用率不高的问题,业界专家建议从算力多元化、算力调度、应用生态、运营模式四个方面入手,提升智算中心利用率。

一是推动算力多元化,满足不同场景需求。智算中心应提供多元化的算力,满足不同行业、不同应用场景的需求。例如,针对图像处理、语音识别等场景,智算中心应提供高性能的GPU算力;针对自然语言处理、推荐系统等场景,智算中心应提供高效的CPU算力;针对自动驾驶、智能制造等场景,智算中心应提供高可靠的FPGA算力。

二是加强算力调度,实现算力资源高效利用。算力多元化要求智算中心具备异构算力融合能力。算力调度是算力资源效率最大化的路径。算力调度需要解决算力资源异构性、算力需求动态性、算力资源分布性等挑战。算力调度将算力资源在不同用户、不同应用、不同时间进行动态分配和优化,以提高算力资源利用率和降低算力成本。目前,地方政府、科研机构、算力企业等多方主体积极布局算力调度领域。据不完全统计,目前国内在建和已经建设的算力调度平台超过20个。

2024-11-19_141236.jpg

从算力多元化、算力调度、应用生态、运营模式四个方面入手,提升智算中心利用率。

三是完善应用生态,促进算力与数据、算法协同。应用生态是指基于智算中心提供的算力资源,构建面向不同行业、不同应用场景的算法模型和应用软件。完善的应用生态可以吸引更多用户使用智算中心提供的算力资源,从而提高算力利用率。

完善应用生态需要政府、企业、高校和科研机构等多方共同努力。政府应加强政策引导,鼓励企业、高校和科研机构基于智算中心开展算法模型和应用软件研发;企业应加强与高校和科研机构的合作,共同推动算法模型和应用软件的研发和应用;高校和科研机构应加强对人工智能领域人才的培养和引进,为算法模型和应用软件的研发提供人才支撑。

四是创新运营模式,实现算力资源可持续运营。智算中心建设投资大、运营成本高,如何实现算力资源的可持续运营是智算中心面临的又一挑战。创新运营模式,实现算力资源的共享、交易和增值服务,是提高算力利用率、降低运营成本的有效途径。

创新运营模式需要政府、企业、用户等多方共同参与。政府应加强政策引导,鼓励企业开展算力资源共享和交易;企业应加强与用户的合作,共同探索算力资源的共享、交易和增值服务模式;用户应积极参与算力资源的共享和交易,降低自身算力成本。

 

1作者:赵妍 来源:通信产业网 编辑:顾北

 

声明:①凡本网注明“来源:通信界”的内容,版权均属于通信界,未经允许禁止转载、摘编,违者必究。经授权可转载,须保持转载文章、图像、音视频的完整性,并完整标注作者信息并注明“来源:通信界”。②凡本网注明“来源:XXX(非通信界)”的内容,均转载自其它媒体,转载目的在于传递更多行业信息,仅代表作者本人观点,与本网无关。本网对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。③如因内容涉及版权和其它问题,请自发布之日起30日内与本网联系,我们将在第一时间删除内容。 
热点动态
普通新闻 突破五大制约因素:智算中心如何提高利用率
普通新闻 习近平向2024年世界互联网大会乌镇峰会开幕视频致贺
普通新闻 走“新”更走“心”,进博会三星AI“圈粉”青少年
普通新闻 科立讯闪耀2024中国国际应急管理展览,携上百款应急通信产品亮相
普通新闻 中国移动副总经理张冬:引领5G A2融合创新 赋能新型工业化发展
普通新闻 官宣定档!2025北京国际低空产业博览会来了!
普通新闻 核心替代 新质金融 2024国产数据库创新生态大会成功举办
普通新闻 天正方案闪耀2024中国通信能源大会
普通新闻 深算院崖山发布核心平替战略 加速金融数智化跃迁
普通新闻 欧拉中国服务器操作系统份额达50%,openEuler开源五年树立新里程
普通新闻 5G赋能千行百业|5G赋能智慧医疗 让百姓健康更有“医”靠
普通新闻 中小企业发展指数全面上升是积极信号
普通新闻 中国卫通卫星互联网企业级产品亮相中国航展
普通新闻 2024全球6G发展大会在上海举行
普通新闻 拓展场景释放公共数据价值
普通新闻 我国快递业历经“双十一”大考之变
普通新闻 无人机快递舱“飞”入社区 深圳加速构建低空起降设施网络
普通新闻 2024大湾区科学论坛开幕在即,中国联通大湾区创新能力布局即将发布
普通新闻 战略签约!用友与联通数科共启央国企数智化转型新征程
普通新闻 海能达赢得智利宪兵队TETRA专用通信系统实施项目
通信视界
我国科学家研制出世界首款类脑互补视觉芯片“
普通对话 6G进展如何?离我们还有多远?独家专访6G推
普通对话 5G赋能千行百业.专家谈|GSMA大中华区公共政
普通对话 巾帼不让须眉!且看高质量信息科技背后的智
普通对话 我国科学家研制出世界首款类脑互补视觉芯片
普通对话 李彦宏:不断地重复开发基础大模型是对社会
普通对话 中兴通讯徐子阳:强基慧智,共建数智热带雨
普通对话 邬贺铨:移动通信开启5G-A新周期,云网融合
普通对话 华为轮值董事长胡厚崑:我们正努力将5G-A带
普通对话 高通中国区董事长孟樸:5G与AI结合,助力提
普通对话 雷军发布小米年度演讲:坚持做高端,拥抱大
通信前瞻
我国实现“县县通千兆、乡乡通5G”
普通对话 记者调查:客服电话转人工,咋越来越难了?
普通对话 安徽推动新型信息基础设施协调发展
普通对话 我国实现“县县通千兆、乡乡通5G”
普通对话 “百模大战”中,工业大模型如何闯出“新天
普通对话 经济聚焦·访智能制造 解行业痛点
普通对话 60秒解锁“北斗+”“+北斗”
普通对话 需求激增 算力基础设施加快落地
普通对话 我国国产首颗全电推通信卫星亚太6E卫星成功
普通对话 SpaceX离第四次发射星际飞船又近一步
普通对话 哈勃望远镜步入暮年,陀螺仪仅剩2个,NASA打
普通对话 顶层设计完善 智慧城市建设开足马力
普通对话 中央企业智能算力规模加速增长
普通对话 工信部规划1亿个专用号用于车联网发展,将如
普通对话 邬贺铨院士解读ChatGPT等数字技术热点
普通对话 华为云Stack智能进化,三大举措赋能政企深度
推荐阅读
Copyright @ Cntxj.Net All Right Reserved 通信界 版权所有
未经书面许可,禁止转载、摘编、复制、镜像