您现在的位置是:时尚 >>正文
大模型算力荒?浪潮信息也来“掘金卖铲”87岁晚节不保,这次再多的名和利,都救不了“自毁前程”的魏纪中
时尚11571人已围观
简介图片来源@视觉中国刚刚过去的一周,浪潮信息发布新品OGAIOpen GenAI Infra)元脑生智,意在为大模型业务提供AI算力系统环境部署、算力调度及开发管理能力的软件栈。浪潮信息作为一家以服务器 ...
图片来源@视觉中国刚刚过去的掘金卖铲一周 ,浪潮信息发布新品OGAI(Open GenAI Infra)元脑生智,大模多的的魏意在为大模型业务提供AI算力系统环境部署、型算信息算力调度及开发管理能力的力荒浪潮利都软件栈。浪潮信息作为一家以服务器为主营业务的也岁企业 ,受到来自生成式AI带来的晚节算力牵引潜力,下游客户需求旺盛,不保但另一方面
,次再在英伟达、名和英特尔等供应商出口限制的救不纪中影响下,人工智能芯片普遍短缺,自毁做软件 ,前程也是掘金卖铲增强市场竞争力的多一种选择
。浪潮信息高级副总裁刘军告诉钛媒体
,大模多的的魏当前阶段仍处于大模型开发阶段 ,型算信息除了缺算力外,基础模型能力还没有足够高的提升,最终呈现出来的效果也不见得会真正能投入使用。刘军认为,算力供给解决到一定程度,基础大模型的开发能力提升到一定程度,就具备了商业化能力 ,进而在各类场景、应用的落地通道也就打开了。而在中国,现阶段能真正达到GPT-4的模型的还没有,这就意味着将应用创新能力都寄托在OpenAI上也是明显不可能,也是不现实的
。大模型也需要生产力工具据公开信息,2021年9月,浪潮信息就已经在研发大模型 ,面向大模型场景解决方案,支持AI芯片 、服务器 ,以构建低时延的分布式系统。浪潮信息发布参数量为2457亿的中文大语言模型“源1.0”
。在“源”大模型的研发过程中,浪潮信息的AI团队逐步建立了完整的从公开数据爬取到数据清洗
、格式转化、数据质量评估的完整流程和工具链 ,并完成了5TB高质量中文数据集的清洗工作。“源”大模型的数据集和清洗经验和帮助国内不少AI团队提升了其大模型的性能表现。在这个过程中
,浪潮信息遇到了很多大模型研发应用中的问题 ,例如公共算力调度问题、数据清洗问题、大模型分布式训练性能不佳等等。为此
,浪潮信息团队从三个层面进行优化 :一是系统全栈性 ,对于涉及多团队
、多环节、多流程的业务,需要系统性架构和全栈解决方案;二是兼容适配性
,由于模型训练需要大量的开源工具
、组件,但存在兼容和性能方面的问题;三是性能优化的挑战,一个大的集群系统涉及的组件数以千计 ,怎样优化性能是问题 。举个例子
,针对于提升大模型分布式训练的计算效率 ,特别是在实际的AI集群环境中 ,可能存在GPU之间的互联带宽受限,或者AI服务器之间的网络互联带宽有限的情况,浪潮信息自2022年以来为客户将大模型训练的GPU峰值效率从30%左右提升到50%,提升GPU利用率 。而在“源”大模型研发过程中
,针对千卡规模算力的高效调度问题 ,浪潮信息通过对云原生的调度系统进行了改造来大幅加速其启动速度,并重点解决了RDMA网络在容器中的接入和适配优化
,从而采取构建满足大模型需求的算力调度系统;针对训练任务的长期稳定运行问题,浪潮信息还引入了多种对集群性能的监控手段和性能数据分析方法
。客户最关心什么但实现AIGC的能力
,除了算力资源的限制外,仍存在诸多技术难点
,包括在模型的训练 、效果测评、落地场景应用方面兼具挑战性
,对普通开发者和中小企业来说更是可望不可及 。整体来看,OGAI(Open GenAI Infra)元脑生智软件栈由5层架构组成
,从L0到L4分别对应于基础设施层的智算中心OS产品 、系统环境层的PODsys产品 、调度平台层的AIStation产品、模型工具层的YLink产品和多模纳管层的MModel产品。L0层智算中心OS的定位是面向智算中心等公共算力服务平台,面向多租户场景,提供灵活多样的以裸金属为主的AI算力服务。L1层PODsys聚焦于AI集群部署场景
,提供了包括基础设施环境安装 、环境部署 、用户管理
、系统监控和资源调度一整套工具链 ,旨在打造一个易用、高效、开放
、兼容的智算集群系统环境部署方案。L2层AIStation聚焦于AI开发场景,通过云原生技术对集群系统中的计算资源 、存储资源和网络资源进行统一的接入和纳管,提供了易于使用的开发环境和作业管理界面,并基于内置算力调度系统和训练稳定保障系统来实现易于接入 、按需分配、弹性扩展和高效稳定的AI研发应用支撑平台
。L3层YLink聚焦于大模型的开发过程 ,通过集成整合浪潮信息在大模型研发过程中的工具和开源工具,为用户提供高效、便捷与标准化的大模型开发与优化流程。L4层MModel定位于多模型管理与服务平台,帮助客户更好地管理和评估模型 ,加速模型的部署和应用
。浪潮信息人工智能与高性能应用软件部AI架构师Owen ZHU还告诉钛媒体
,“现在企业面临的最大挑战是,需要用大规模硬件的基础设施才能够训练一个类似于ChatGPT同等能力的模型,这个复杂性是固有的。”他解释 ,OGAI技术栈是从L0到L4层是分层解耦设计和实现的,也就是说并不用把整个OGAI技术栈提供给用户 ,才能够实现大模型开发
,而是对应需要实现的层级功能进行选择。如果用户只需要提供算力多租户的裸金属方案,可能只需要L0层智算中心OS,不用关心最终用户会怎样进行大模型开发;如果用户需要模型开发相关工具链 ,可以按需选择L3层YLink提供的各类工具进行研发生产。关于发布OGAI的初衷,Owen ZHU指出,“浪潮信息做这件事情,是先行者 ,这是由视角决定。浪潮信息服务了全球客户,包括国内也是最主要的AI应用客户群体,能够第一时间感知到大模型市场在缺什么 ,遇到了哪些问题。”从用户的角度来看 ,更强的算力基础设施也会倒逼需求侧进一步升级
。“做模型的不懂算力 ,做算力的不懂模型”,这种情况长期存在,但很多算法的创新与硬件的发展是相辅相成
,两者又需要共同发展。浪潮信息的这一做法是否切实可行,仍需市场来验证。(本文首发钛媒体APP
,作者 | 杨丽)
Tags:
相关文章
15胜4负登顶联盟第一!森林狼加入西部争冠行列?25+2!19+3!压哨加盟太阳,从替补到第三巨头,你真的被低估了
时尚体坛周报全媒体记者 李辉 明尼苏达,登顶联盟第一。 北京时间12月3日,森林狼客场有惊无险123比117击败黄蜂,豪取4连胜的同时,将他们的战绩提升至15胜4负,放眼整个联盟,只有凯尔特人 ...
【时尚】
阅读更多快船惜败掘金!乔治+哈登回暖,伦纳德成牺牲品,泰伦卢主导败局
时尚原来快船险胜掘金!乔治+哈登复活,伦纳德成牺牲品,泰伦卢领兵败北标题:乔治+哈登复活,伦纳德成牺牲品,泰伦卢领兵败北副标题:快船队对阵掘金队表现出色,但最终以微弱优势落败介绍:快船队与掘金队的上一场比 ...
【时尚】
阅读更多“中国善士·微博”2023年度慈善盛典奖项报告火热妨碍中
时尚11月10日,由《中国善士》以及微博散漫主理的2023年度慈善盛典奖项报告评选使命正式启动。同步凋谢年度人物的推选以及年度典型机构、年度优异名目、年度优异转达案例、年度村落子复原贡献、年度数字公益 ...
【时尚】
阅读更多
热门文章
最新文章
友情链接
- 剪刀手爱德华Facebook
- 冯德伦官网
- 幽灵公主微博
- 陈意涵博客
- 关咏荷博客
- 李晨博客
- 狮子王TikTok
- 郑中基官网
- 石班瑜Facebook
- 郭书瑶Twitter
- 林子聪主页
- 陈思诚博客
- 梅艳芳抖音
- 放牛班的春天Facebook
- 盗墓笔记TikTok
- 黄宗泽主页
- 尔冬升Facebook
- 张艺兴Twitter
- 陈柏霖官网
- 罗志祥Weibo
- 原创 CBA最帅教练塌房?杨鸣被曝婚内出轨?妻子深夜发声表态成焦点
- 篮网豪取十一连胜!战绩榜跨越雄鹿,登顶东部第二!
- 能量满满!威少半场5中2拿下4分4板2助
- 米兰换帅条件曝光,国米勋绩有望接手米兰帅位,皇即将将或者加盟
- 【特稿】科学家发现“完美太阳系”刘德华的女儿高清正脸照好漂亮!完美的继承了刘德华的好基因。
- 29日NBA季中赛前瞻:八强将全副发生 怯夫火箭等16队相助6个名额
- 嫦娥五号月壤揭示月球玻璃抗老化原因
- 20场13球3助!德甲“黑店”又挖到宝:3度戏耍曼城,来年或卖1亿
- 五大联赛仅剩3支不败球队:拜仁、勒沃库森以及尼斯
- 快船输掘金!小卡哈登喜忧参半,乔治威少主导败局,雷吉手刃旧主