返回首页

人工智能时代 算力网络如何从“可用”到“好用”

阅读量:176 2023-03-02 收藏本文

预训练模型是科技行业近两年最受关注的AI热点之一。近期,ChatGPT作为一款现象级AI应用,在全球的关注度持续走高,国内类ChatGPT应用的发展备受期待。

面对上百亿、万亿规模的训练参数,对算力、数据、算法均提出更高的要求,使得人工智能成为算力相关产业发展的内在动力。而人工智能算力网络的出现,可显著降低算力使用门槛、以及人工智能应用门槛,通过不断引入新的AI方法及算力基础设施,推动算力及AI应用从“可用”走向“好用”。



为联络计算技术领域企业技术高管进行交流分享,促进相互间及和学术界的合作,探讨未来技术发展方向及技术如何改善人们的生产和生活方式,由CCF CTO Club发起的CCF C³活动在2月23日走进并行科技。多位来自行业的专家、学者与现场近30位嘉宾于当日共聚并行科技北京总部,以“算力网络赋能人工智能”为主题,分享行业前沿技术,共谋发展方略。 


图片

 CCF C³活动走进并行科技


活动现场由北京并行科技股份有限公司AI云事业部总经理赵鸿冰主持,CCF副秘书长、企工委主任、亿邦动力CEO王超,CCF常务理事、北京并行科技股份有限公司董事长陈健分别致词。同时,陈健还与北京智谱华章科技有限公司CEO张鹏、北京大学人工智能研究院助理教授(博导)杨耀东分别为参与活动的嘉宾带来了主题报告分享,并与中科院计算机网络信息中心人工智能技术与应用发展负责人/研究员王彦棡、北京深势科技有限公司研发负责人陆金谭、北京超级云计算中心CTO郭宇及现场嘉宾就相关话题展开讨论,以多维度的专业视角为行业发展献计献策。此次活动在B站、并行科技视频号、量子位视频号等线上平台共计吸引了9500多人在线观看,为CCF C³本年度的活动带来了精彩开端。


图片

 赵鸿冰主持活动


图片

 王超致辞


分享 · 共话人工智能新发展


陈健在当天以“ChatGPT背后的算力需求”为引导,为大家带来《人工智能算力网络从“可用”到“好用”》的主题分享,介绍了并行科技是由超算入手探索行业发展,提前着手布局“算力网络”建设,并积极响应国家近年来的“东数西算”发展政策,旨在聚合国内优质超算算力,实现超算算力资源、应用资源、数据资源的共享与交易,面向终端用户提供多样化的算力服务。


图片

 陈健做主题报告


并行科技目前已上线包括天翼云、广东联通、福建移动在内的“三大运营商”算力资源,并与广州超算、北京超算、济南超算、中科院超算、浙江超算、宁夏超算等国产算力资源在内的大批优质算力资源结合,共计接入超80,000台服务器,总计算力超1,000PFlops,存储资源超800PB,配合并行科技先进的“云端租用”模式,可实现算力资源高效、快捷、按需分配的和合理化使用,使其真正成为一种像水、电一样的生产力资源。陈健还表示,并行科技内蒙古算力基地预计在今年年底投入使用,将为国内“算力网络”的建设填筑新的资源。王超代表CCF在陈健分享后为C³活动承办方并行科技颁发了承办单位感谢牌。


图片

 王超(左)向陈健(右)颁发承办单位感谢牌


对于ChatGPT背后的核心技术——预训练大模型,张鹏在活动中为嘉宾们带来以《千亿大模型:AIGC时代的基座》为主题的分享,并着重介绍了由清华大学知识工程实验室(KEG)与智谱AI 共同研发的大规模中英文预训练语言模型GLM-130B 。这是一个可与GPT-3基座模型对标的开源双语模型。张鹏表示,在同等运算速度与精度的要求下,GLM-130B对显存资源的消耗可节省75%,可帮助科研机构有效降低算力运营成本。自2022年8月发布以来,GLM-130B已收到41个国家266个研究机构的使用需求。在Stanford报告的世界主流大模型评测中,它是中国唯一入选的模型,其准确性、恶意性与GPT-3持平,鲁棒性和校准误差在所有模型中表现最佳。


图片

 张鹏做主题报告


杨耀东是此次主题分享环节的最后一位嘉宾。作为一名年轻有为的“学术派”,他以《序列化群体决策》为题向现场嘉宾剖析了ChatGPT成功的具体原因,提供了从理论研究角度看问题的视野。同时,结合自身丰富的学术研究背景,对ChatGPT的性能表现及未来优化给出了阐释及说明,尤其是如何用ChatGPT赋能智能决策、具身智能、多智能体决策问题。他重点介绍了决策问题如何通过序列模型建模,以及决策序列如何与大语言模型的输出对齐等问题。


图片

 杨耀东做主题报告


交流 · 迎接新的机遇与挑战


在主题报告分享结束后,三位演讲者又与现场嘉宾及场外观众围绕《算力网络环境下AI发展的新机遇和新挑战》进行探讨。陈健作为该环节主持人,从“人工智能领域发展过程中,从自身以及行业感受到,在算力方面遇到哪些瓶颈和挑战?”这一问题展开了与嘉宾们的交流。 


图片

高峰论坛

左起:赵鸿冰 杨耀东 张鹏 陆金谭 王彦棡 郭宇


张鹏表示,算力是由市场驱动的,随着技术的进步,各领域对算力的需求会越来越高。未来,行业中涌现的解决方案会更加多元化。不仅是要在硬件层打造更先进的芯片,在宏观资源调度层,诸如并行科技算力网络的方式也是解决算力问题的好思路。而最终,或许将形成宏观层有算力网络,硬件层有强大芯片,中间层有软件做算法优化与加速这种“多向奔赴”的方式。王彦棡对此补充道,在人工智能领域,软件的确是需要大家关注的重点,它是构成行业生态的关键,容易出现“卡脖子”问题,做好未雨绸缪,才能应对不断变化的发展时局。


在有关“算力网络环境下,各位嘉宾认为在促进AI发展方面存在哪些新机遇和新挑战”的议题中,赵鸿冰表示,算力网络接下来的发展重点是算力接入标准化的进一步建设,这会使更多算力资源被有效的接入到算力网中,满足需求端的灵活使用。而目前,在算力网络模式下,我们已经看到了优秀的应用案例,比如并行科技的应用云产品就可根据具体应用的特征、算力平台实时忙闲等情况进行动态算力调度。对此,我们在畅想,未来是否可以基于算力网络来实现大模型训练,这需要我们在算力网络分布式计算技术等相关领域做进一步研究。历史上,电力网络的构建曾为人类带来福祉,随着算力网络建设的日新月异,新机遇已近在眼前。

 

图片

现场互动及观点分享


在此环节,现场嘉宾及场外观众也向专家们踊跃提问:

  • 量子计算机的出现,是否会颠覆算力网络?


    王彦棡表示,量子计算机可能会在未来增加算力网络在专用计算方面的能力,而对通用计算来说,这一前沿技术目前还有很长的路要走。


  • ChatGPT是否需要做算法方面的创新?


    杨耀东表示,对ChatGPT来说,可能不需要。他在回答中引用了ChatGPT项目负责人的一句话“人们通常会低估一个简单的想法实现好后对效能的增长;而过于高估一个全新想法能带来的效能增长”。他认为,即便ChatGPT看似简单,如果能在工程化方面做到极致,也会有非常好的应用效果。


  • 算力网络在提供服务时如何保障用户数据安全?


    赵鸿冰表示,无论是单个算力中心还是算力网络,所承接的业务形态是一致的。简单来说,不适合在开放网络中进行计算的内容就不会被提供到算力中心或算力网络中。


  • ChatGPT诞生在国外,它为什么可以理解中文?


    张鹏表示,ChatGPT在大模型的训练过程中会应用中文数据,只是从占比上来看,英文数据会相对较多,所以它的英文能力也会比中文能力更强。



  • 基于ChatGPT目前在应用中的表现,是否可以判定它已经产生了智能?


    杨耀东表示,从某种角度上来看,我们可以说ChatGPT已经产生了“智能”。但这个“智能”是不是通常科学定义的智能,或者说,我们自身又如何定义智能?这本身也是需要进一步探讨的问题。


  • 未来有可能由多个远距离算力节点进行联合计算吗?


    陈健表示,当年网格计算就在不断研究这个问题,结论是可以做,但需要考虑此方案下对带宽的极高要求,其综合性价比相对较低。


在本场活动环节的最后,陈健对算力领域发展提出了自己的期望。他表示,我们希望通过算力网络实现一件事,就是为终端用户打造供应链安全的算力网络服务。但这需要国产应用的快速发展,因为只有这样,我们自己的硬件、软件、才能更好的在云化环境下形成强有力的整体,诸如软硬件适配的相关问题才会得到行之有效的改善,这需要所有人的共同努力。


未来,并行科技也将继续在“东数西算”政策的指引下,不断探索与实践“超算电网”模式的新发展、新思路,践行“助力科技强国,让计算更简单”的企业使命,使前沿科技成为助力国家各行业升级转型的工具,为我国在新时代的发展奠定有利基础。


并行科技感谢CCF邀请承办本次CCF C³活动,也预祝CCF C³接下来的活动更加精彩,从分享到交流,碰撞出更多新的想法,不断为发展埋下新的种子。


图片

 颁发感谢牌



并行科技简介:


北京并行科技股份有限公司(简称并行科技 股票代码:839493)成立于2007年,是国内领先的超算云服务及运营提供商,提供超算云、超算行业云、智算云、设计仿真云和计算资源建设及运营服务。并行科技现已服务20+应用行业、10,000+单位、1000+企业、20,000+专属微信服务群,累计提供100亿核时机时。未来,并行科技将继续秉承“助力科技强国,让计算更简单”企业使命,致力成为世界领先的超算云服务和运营服务提供商,为用户提供“多快好省”的超算云服务。


本次C³活动由CCF公司会员并行科技承办,点击“阅读原文”加入CCF公司会员!


合作单位


图片