CNCC | 国产智能算力与大模型系统

阅读量:2 2024-10-13 收藏本文

CNCC2024

论坛简介：

国产智能算力与大模型系统

举办时间：10月25日13:30-17:30

地点：夏苑-意大利馆一楼

注：如有变动，请以官网(https://ccf.org.cn/cncc2024)最终信息为准

人工智能技术正以前所未有的速度蓬勃发展，各种大模型不断涌现，它们在诸多领域展现出了巨大的潜力。随着模型规模的扩大，模型对计算资源的需求也呈现出爆炸式的增长。然而，鉴于当前的形势，中国在获取最先进的算力方面面临巨大的挑战。因此，如何充分发挥国产智能算力，满足大模型对算力的巨大需求，具有重要意义。

本论坛聚焦此问题，探讨国产智能算力和软件如何有效支撑大模型系统。论坛将研讨最新的技术、方法与实践，包括但不限于国产智能算力、大模型训练和推理优化、大模型系统软件生态等关键主题。本论坛邀请学术界和企业界知名专家和学者共同探讨并分享他们的见解与经验，以推动国产智能算力的发展。

论坛日程

顺序	主题	主讲嘉宾	单位
1	智能革命芯引擎——大模型与大算力芯片的共生演进	杨建	沐曦集成电路（上海）有限公司
2	构建兼容多元加速卡的AI基础设施	崔慧敏	中国科学院计算技术研究所
3	从语言大模型到代码大模型	车万翔	哈尔滨工业大学
4	高效能大模型推理服务系统的研究与实践	刘譞哲	北京大学
5	共建多元AI芯片软硬件生态，助力大模型创新与应用	李涛	北京智源人工智能研究院
6	人工智能开放计算体系落地实践	张行程	上海人工智能实验室
7	Panel环节	杨建	沐曦集成电路（上海）有限公司
		崔慧敏	中国科学院计算技术研究所
		车万翔	哈尔滨工业大学
		刘譞哲	北京大学
		李涛	北京智源人工智能研究院
		张行程	上海人工智能实验室

论坛主席及嘉宾介绍

论坛主席

翟季冬

CCF杰出会员、高性能计算专委副主任，清华大学长聘教授、计算机系高性能所副所长

简介：清华大学计算机系长聘教授，博士生导师。国家杰出青年科学基金获得者，国家重点研发计划项目负责人。清华大学计算机系高性能所副所长。CCF高性能计算专委副主任、CCF杰出会员、ACM中国高性能计算专家委员会秘书长。主要研究领域包括并行计算、编程模型与编译优化。在并行计算与系统领域顶级会议和期刊发表论文100余篇，出版英文专著1部。研究成果获IEEE TPDS 2021最佳论文奖、IEEE CLUSTER 2021最佳论文奖、ACM ICS 2021最佳学生论文奖等。担任NPC 2018程序委员会主席、IEEE CLUSTER 2021领域主席，IEEE Transactions on Computers等多个国际学术期刊编委。担任清华大学学生超算团队教练，指导的团队十四次获得世界冠军。获教育部科技进步一等奖、2021年CCF自然科学一等奖、2020年CCF-IEEE CS青年科学家奖。

论坛讲者

杨建

CCF高性能计算专委执行委员，沐曦集成电路（上海）有限公司CTO

简介：2002年获得浙江大学计算机科学与技术博士。2020联合创立沐曦集成电路（上海）有限公司，兼任沐曦首席软件架构师，主要研究方向为三维图形硬件体系结构与高性能计算架构及生态，拥有10多项海内外发明专利。此前曾就职于多家GPU芯片公司，包括Trident, S3 Graphics，ATI/AMD，海思半导体上海等，参与及主导数十余款GPU产品(55nm至7nm) 量产全流程，曾任AMD大中华区第一位科学家(Fellow)。2023年5月中国共产党上海市浦东新区委员会授予“首届浦东新区科技精英”荣誉称号。

报告题目：智能革命芯引擎——大模型与大算力芯片的共生演进

摘要：后摩尔定律的计算致力于解决内存墙、功耗墙、通讯墙，继续延续摩尔定律两年提供2倍单芯片算力的提升，实现算力侧的供给提升。大模型的需求侧需要Scaling Law提供2年750倍的算力需求。如何解决算力需求侧与供给侧的创新之路在于集群系统创新与算法创新。

崔慧敏

中国科学院计算技术研究所研究员、编程与编译方向学术带头人

简介：博士，中科院计算技术研究所研究员，博士生导师，中科院计算所编程与编译方向学术带头人。主持过多项NSFC、973、重点研发计划、2030新一代人工智能重大专项某编程项目等国家级科研项目。发表包括ASLPOS、MICRO、PLDI、PPoPP、OSDI、SC、TOCS、TPDS、TACO等编译和系统领域的顶级国际会议和期刊上论文40余篇。

报告题目：构建兼容多元加速卡的AI基础设施

摘要：在大模型和国产AI芯片发展双驱动下，国产AI芯片软件生态面临新的挑战和机会。编译技术成为一大破解之道，在AI芯片和应用落地之间架起重要桥梁，实现通用化、高性能，低成本的算力释放。本次报告将结合学术和产业实践，分享包括如何最大限度地挖掘AI芯片潜力，以及如何实现AI应用在异构硬件平台上高性能适配，突破生态鸿沟，构筑软硬件完全自主可控的算力基座。

车万翔

哈尔滨工业大学长聘教授、人工智能研究院副院长

简介：哈尔滨工业大学计算学部长聘教授/博士生导师，人工智能研究院副院长，国家级青年人才，龙江学者“青年学者”，斯坦福大学访问学者。现任中国中文信息学会理事、计算语言学专业委员会副主任兼秘书长；国际计算语言学学会亚太分会（AACL）执委兼秘书长；国际顶级会议ACL 2025程序委员会共同主席。承担国家自然科学基金重点项目、2030“新一代人工智能”重大项目课题等多项科研项目。著有《自然语言处理：基于预训练模型的方法》一书。曾获AAAI 2013最佳论文提名奖。负责研发的语言技术平台（LTP）已授权给百度、腾讯、华为等公司付费使用。2016年获黑龙江省科技进步一等奖（排名第2），2020年获黑龙江省青年科技奖。

报告题目：从语言大模型到代码大模型

摘要：由自然语言处理技术孕育而生的大模型已经成为人工智能领域的一个重要突破。这些模型通过大规模语言数据训练，能够实现对文本的深度理解和生成。然而，大模型的应用远远超过文本处理，其在代码上也展现出巨大的潜力，进而衍生出了代码大模型。代码大模型可以学习和理解各种编程语言，完成代码生成、摘要等典型编程任务，极大提高了开发效率。与此同时，代码所具备的高度结构化、可执行以及长距离依赖等特性，又反哺了对语言的理解和生成，提升了大模型逻辑推理、工具调用以及复杂问题分解与规划等能力。本报告将系统介绍语言大模型和代码大模型的基本概念、发展历程、技术原理以及应用场景。

刘譞哲

CCF服务计算专委副主任，北京大学博雅特聘教授

简介：北京大学博雅特聘教授，国家杰出青年科学基金获得者，ACM杰出科学家。研究方向为系统软件，服务计算等。在SOSP、OSDI、NSDI、ICSE、WWW等发表论文100余篇，获WWW最佳论文奖等荣誉10余次。获国家技术发明一等奖、教育部“青年科学奖”、2018年CCF-IEEE CS青年科学家奖等。

报告题目：高效能大模型推理服务系统的研究与实践

摘要：随着大模型开始逐渐进入到各个行业，如何保障不同场景下大模型推理的服务水平目标（SLO）的同时提高吞吐量是大模型服务系统构造的核心关键问题。本报告将从大模型推理服务的特点出发，介绍高效能的大模型推理服务系统--泛睿及其关键技术，包括：（1）面向多LoRA大模型的动态编排技术，通过动态编排请求和LoRA适配器，提升LoRA大模型推断服务的效率；（2）预填充与解码计算解耦分离技术，旨在通过为两个阶段动态调整资源分配与并行策略，优化LLM推断服务的性能；（3）可变长度窗口弹性序列并行技术，以弹性适应不同对话窗口长度请求和阶段之间的变化性。实验结果表明，泛睿系统可以有效地提升GPU资源利用率，降低推理服务延迟，相对vLLM等基线系统吞吐量提升1个数量级。

李涛

北京智源人工智能研究院AI系统研发经理

简介：主要技术方向聚焦在智能算力调度平台、AI编译器和AI芯片研究。先后在多家互联网大厂担任技术主管/专家，从事人工智能研发工作，包括基础技术研发和应用落地。

报告题目：共建多元AI芯片软硬件生态，助力大模型创新与应用

摘要：2024年，AI大模型发展进入新阶段，模型参数和训练数据量剧增，模态更多样，计算规模空前庞大。在算力需求增长而资源供应紧张的局面下，新兴的各种AI芯片硬件架构不一、指令集不一、各自有自己的AI编译器，算子库也各自实现，整体呈现十分割裂且难以强大的生态，厂商的生态适配仍旧面临开发难度大、任务重以及各自为战的难点。智源研究院以大模型的计算需求为导向，面向多元芯片、借助Triton编译器的开源和轻量级优势，提供了一套易适配、高性能的算子库，共建统一开源的软硬件生态。

张行程

上海人工智能实验室系统平台中心负责人

简介：上海人工智能实验室系统平台中心负责人，青年科学家。曾任商汤科技训练平台与服务部总监，负责商汤内部深度学习框架SenseParrots，以及基于训练框架与训练技术的一系列生产与服务工具。现带领团队支持上海人工智能实验室千亿参数模型高效稳定训练，参与浦语-书生大语言模型预训练。打造DeepLink 人工智能开放计算体系，推动训练芯片的标准化建设，包括评测标准、适配标准等工作。拉通多家主流国产芯片厂商进行标准化适配。于2023年获得临港十大科创先锋称号。

报告题目：人工智能开放计算体系落地实践

摘要：当前人工智能国际主流生态通过软硬件两端同时发力，构筑了成熟完善的基础软件体系，紧密协同的上层软件生态，有效衔接的下游价值链闭环。近年来，我国人工智能软硬件均取得了较大发展，逐渐形成了涵盖计算芯片、开源平台、基础应用、行业应用及产品等环节较完善的人工智能产业链。但仍然存在软硬件碎片化的问题，严重阻碍基础设施形成合力，造成当前硬件芯片适配模型支持少、易用性低、性能较差、应用场景较为局限的局面，探索人工智能底层技术软硬件适配之路，我国AI芯片亟待迈出从产线走向应用的坚实一步。本报告将从国产AI生态技术栈面临的困境着手，依次拆解各个层次所面临的问题并给出对应解法，希望通过本次分享带给大家一些新的思路。

关于CNCC2024

CNCC2024将于10月24-26日在浙江省东阳市横店镇举办，大会主题为“发展新质生产力，计算引领未来”。大会为期三天，包括18个特邀报告、3个大会论坛、138个专题论坛及34场专题活动和100余个展览。图灵奖获得者、两院院士、国内外顶尖学者、知名企业家在内的超过800位讲者在会上展望前沿趋势，分享创新成果。预计参会者超过万人。

<<< 上一篇 CNCC | 面向扩展现实的数字内容智能生成：前

惊鸿一瞥！独家揭秘CNCC2024会场非凡魅力，不下一篇 >>>

<<< 下一篇惊鸿一瞥！独家揭秘CNCC2024会场非凡魅力，不