底层算力也正在进入软件定义一切的时代 | CCF C³中电金信
我们统计20万篇基础科研论文,有34%左右都使用了AI。
我们支撑AI For Scinece变革,其实就是AI For Scinece大量工具的构建。算力正变成不可获缺的一个部分。
底层算力也在进入高度虚拟化、软件定义一切的时代。
CCF C³最近来到中电金信上海总部,多位来自行业的专家、学者与现场嘉宾以“超级算力时代的新格局”为主题,分享行业前沿技术,探讨如何构建多元化计算架构背景下构建数字基础设施。
复旦大学教授王新、中银金科创新研究中心助理总经理陈志、复旦大学CFFF平台执行主任程远、中电金信研究院副院长陈书华院长参与。
整个高峰对话由中电金信商业分析事业部总经理杜啸争主持。
产学研如何看算力重构?
杜啸争:从学术研究角度,谈谈算力重构/智算平台对我们能有哪些重要的意义,以及在应用推广中有哪些可参考的成功经验。
王新:算力重构支撑并形成智算平台,对于自然科学和社会科学研究提供了必要的计算能力和数据处理工具。算力不是硬件的简单堆叠,要需要结合很多相关技术才能让它发挥最大作用,比如存储技术、新的网络技术,还有充分的数据。它是个成体系的新型计算。比如像医疗领域就有很多应用。
程远:我尝试补充一两点,它其实承载着科研范式的变革,一个是大量科学家所认可的,AI能够以工具的形式去帮助科研,AI可以进化成平台上的工具,或者像传统科研计算软件那样。这一背景下,我们支撑AI For Scinece变革,其实就是AI For Scinece大量工具的构建。
除此之外还需要的其实是人,正在组建的运营团队跟传统超算中心计算团队不太一样,需要一批懂得科研、AI和大规模AI工程的人组合成一个交叉融合的团队。
另外,大算力在帮助我们探索AI在Science里面的边界——纯数据驱动的范式能够解决哪些问题,这一过程会给基础科学带来新的研究课题,可能真的能推动相关领域科学进步。
杜啸争:从应用侧看有哪些困难挑战或者有哪些成功经验跟我们分享?
陈志:智能时代如何将算力基础构建好,应用侧来看,我们首先要做的事是有得用。很多时候算力因为种种限制是没得用的。
在此之后就是要好用和安全地用。尤其是后者,安全第一原则就是业务的连续性。我觉得从最底层要构建我们的安全网,构建我们的安全基座/底座,这块是很重要的。
杜啸争:那产业侧如何看呢?
陈书华:这里面有几个点,第一个是整个中国电子很多企业正在做到“有得用”,努力做到“更加好用”。另外,我们也更加看中架构。要解决“超级”两个字,可能就要靠算力、靠架构来解决。所以我们源启很大的一部分还是通过云原生技术架构,与算力结合。
第二个则是,从依靠高端单品设备,转型到靠架构体系来保障业务的安全、可靠和稳定,它能保持7*24小时连续不断运行,这也是源启作为数字基础设施底座,来解决重点行业这方面的问题。
算力除了安全,普惠也是未来的方向
杜啸争:结合现在研究方向或所在领域、又或者是所在单位主要产品,分别讲述未来的规划。
陈书华:基础设施这块的规划,就是要和亚马逊、谷歌、华为阿里腾讯在一个麻将桌上。
程远:AI For Scinece是复旦重要的工具,CFFF平台是这样布局里面最关键的一个基础设施,人工智能创新产业研究院就是去推进AI For Scinece这个发动机。
陈志:我理解世界创新有三种,第一种是欧洲主导以规则创新,第二种是美国以技术主导创新,中国最大优势在于市场应用,在应用中迭代形成正反馈、正循环。
王新:培养掌握AI智能计算新技能的人才,是我们努力的方向。
杜啸争:跳出自己现有领域,从整个基础设施算力构建方面,还有哪些建议?
王新:虽然很热闹但是刚刚开始,可能未来计算会更快效率更高,更加灵活和弹性。但现在有很多挑战,比如隐私安全的保护。前阵子有个调研,今天搞计算机人工智能是越干胆子越小。积极心态的同时,我们要有一颗敬畏之心。比如现在AIGC生成的内容涌现,无法评判哪些数据是真实的,在真实场景中会孕育深层次的挑战。
陈志:同金融行业一样,算力也讲求两个观点:一是安全,二是普惠。安全大家说得很多,为什么要提到普惠?算力目前不像水电一样哪里都有。以前叫数据孤岛现在叫算力孤岛,这种底层基建处设施如何做成大众拿来用的东西,这是未来一个方向。
程远:在构建CFFF平台时有对国产芯片做过调研,当时除了担心芯片水平外还有生态的缺乏。最近大模型起来之后,建议我们芯片厂商围绕几个头部大模型的支撑做好,这是个很好的机会。很期待明年扩容时会有大量国产芯片支撑我们的科研。
陈书华:今天聊聊民用领域的AI,公司一个AI最佳落脚点就是银行远程服务——用AI来代替客服,但ChatGPT擅长“胡说八道”,银行对客服监管是比较严的,所以还是不敢用。
但在内部使用是可以的,比如给客服人员做提示、知识库抽取以提高工作效率,这是第一个应用领域。第二个是AI语音,但有的一听就是AI造出来的,客户一进来就听到冷冰冰的语音就不太好,这是我们正在解决的问题。
高度虚拟化和软件定义一切的时代
除此之外,况文川还带来了《算力升级转型中的数字基础设施建设探索》主题分享。
首先从超级算力时代下算力新型需求和供给方面。
需求方面,不管是基本的社会计算还是行业基础计算,正在迅速往数据密集型计算,并进一步向智能科研计算方向去发展,对算力的需求呈指数级的快速增长。
供给方面,芯片从传统封闭形态到通用CPU,再到定制化芯片持续发展。今天我们进入到CPU+XPU时代,在存储能力上,存储容量和效率速度都呈现指数级增长。数据库也正在往多模态、多形态方面发展。
我们也在进入一个高度虚拟化和软件定义一切的时代。
他谈到,基础算力元素加速创新,不断出现新的计算需求、新的算力元素,云原生、平台化、软件定义成为多元化计算架构背景下构建数字基础设施的主要途径。
但我们应该注意到的是,从基础软硬件到具备多云多芯多库支持能力的行业基础设施技术平台再到上层的数字化应用,既要能体系性化地通过系统工程解决问题,又要能适应“开放、开源、积木化共建”的场景建设需求,二者在行业数字基础设施建设过程中不可或缺。
随后,对于智能算力在科研创新中的应用,程远带来了《复旦大学CFFF智算平台助力科研创新》的主题分享。
首先他提到最近几年发生的变化:人工智能赋能的领域已经朝着更底层的基础科学研究中去。团队统计了最近这几年 Google Scholar相关的科研论文,在三个领域,材料科学、生命科学、能源科学三个领域,统计接近20万篇相关的论文,发现其中有34%左右都使用了人工智能的技术。就以材料科学为例,最近这三年的趋势呈现了360%左右的增长。
在这场AI for Science范式的变革中,算力正变成不可获缺的一个部分。大的模型需要大的数据大的算力和新的AI的算力,一条腿都不能缺。科研智算平台是参与AI for Science国际竞争的基础。
从学校角度去推进算力平台会遇到一些问题,比如算力不足、算力孤岛制约效能,以及人才培训门槛。
科研智算平台需要从各个层面围绕业务场景去深度定制和研发,要做的事情包括集群计算的加速、融合算力的调度以及AI for Science工具的建设和培训。
复旦建了CFFF平台——Computing for the Future at Fudan,目前是全国高校最大的云上科研智算集群,在院内我们叫做千问一号集群,现在上线了两个多月,快三个月有30多个团队支撑了30多个国家和地方的重点项目已经有200多个。现在也有一些成果,比如伏羲气象预测模型。
(本文转自量子位)