李国杰、梅宏、高文、郑纬民等院士领衔,聚行业顶级智慧,共探大数据之未来!BDTC,倒计时3天
第十七届中国大数据技术大会(简称BDTC 2023),将于2023年12月22日-24日在广州市黄埔区君澜酒店隆重召开。欢迎广大技术爱好者莅临大会现场,与诸多专家学者面对面探讨大数据的核心科学与技术问题,挖掘大数据蕴藏的巨大能量!期待与您一起,同享峰会,共鉴未来! 大会详情如下 大会主席 高 文 中国工程院院士 鹏城实验室主任 北京大学 博雅讲席教授 郑纬民 中国工程院院士 清华大学 计算机科学与技术系 教授 执行主席 程学旗 中国科学院计算技术研究所副所长 CCF大数据专家委员会秘书长 黄跃珍 广州无线电集团有限公司党委书记、董事长 广州数据集团有限公司董事长 广东省政协第十二届委员 广州市第十一次党代会代表 肖侬 中山大学教授 CCF大数据专家委员会副主任 程序主席 谭昶 科大讯飞大数据研究院院长 CCF大数据专委会常委 邱锡鹏 复旦大学计算机科学技术学院教授 MOSS大模型负责人 梁添才 广州广电研究院副院长 国务院政府特殊津贴专家 广东特支计划人才 主论坛特邀嘉宾 李国杰 中国工程院院士 中国科学院计算技术研究所首席科学家 嘉宾简介:中国工程院院士,主要从事计算机体系结构、并行算法、人工智能、计算机网络、信息技术战略等方面的研究,发表论文100多篇,合著英文专著4本,出版了报告论文集《创新求索录》一、二、三集。长期从事国家863计划高技术研究,现任国家“973计划”项目首席科学家。主持研制成功曙光1号并行计算机、曙光1000大规模并行机和曙光2000/曙光3000超级服务器, 获得国家科技进步一等奖和三次二等奖。1994年获得首届何梁何利基金科技进步奖,2000年被评为全国先进工作者。曾任第九届、十届全国人大代表、中共十七大代表、国家信息化专家咨询委员会信息技术与新兴产业专委会副主任、英文版学报《Journal of Computer Science and Technology》主编、中国科学院学位委员会副主席、中国科学院大学计算机与控制学院院长等职。现任中国计算机学会名誉理事长。 报告题目:数据、模型和新科研范式 内容摘要:人工智能的突破主要是靠大算力还是计算模型的转变?人工智能的发展应该以数据为中心还是以模型为中心?大语言模型(LLM)能否成为通用智能模型?机器究竟有没有理解能力?造成大模型有“幻觉”的内在原因是什么?神经元计算模型是否不同于图灵计算模型?智能化科研(AI for Research)与传统的科研方法有什么不同? 以上诸多问题学术界还没有形成共识。本报告从一个不在第一线的“观潮者”的角度,回顾了冯·•诺伊曼等学术前辈的预见,也谈了一些不成熟的看法,供大家参考,旨在抛砖引玉,引起讨论。 梅宏 中国科学院院士 中国计算机学会理事长 嘉宾简介:中国科学院院士,发展中国家科学院院士,欧洲科学院外籍院士,电气和电子工程师学会会士(IEEE Fellow)。主要从事软件工程和系统软件领域的研究。曾获国家技术发明一等奖和二等奖、国家自然科学二等奖、国家科技进步二等奖等科技成果奖励。历任国家863计划专家组成员、组长,国家“核高基”科技重大专项专家组成员,全国信息技术标准化技术委员会大数据标准工作组组长,国家重点科技研发专项“云计算与大数据”实施方案编制组组长、总体组组长,国家“科技创新2030-重大项目”大数据重大项目立项建议和实施方案编制组组长。 郑纬民 中国工程院院士 清华大学教授 嘉宾简介:长期从事高性能计算机体系结构、并行算法和系统研究。提出可扩展的存储系统结构及轻量并行的扩展机制,发展了存储系统扩展性理论与方法。在国内率先研制并成功应用集群架构高性能计算机。在国产神威太湖之光上研制的极大规模天气预报应用获得ACM Gordon Bell奖。曾获国家科技进步一等奖1项、二等奖2项、国家技术发明二等奖1 项,何梁何利科技进步奖,获得首届中国存储终身成就奖。 报告题目:构建支持大模型训练的计算机系统需考虑的四个问题 张宏科 中国工程院院士 北京交通大学教授 嘉宾简介:张宏科,中国工程院院士,现任北京交通大学电子信息工程学院教授、移动专用网络国家工程研究中心主任,IEEE Fellow,曾任两期国家973计划首席科学家。长期从事新型通信网络理论与工程技术研究,为解决国家和行业专网工程急需做出重要贡献。获国家技术发明二等奖2项,省部级一等奖4项。 报告题目:算力网络研究与探索 张东晓 美国国家工程院院士 宁波东方理工大学(暂名) 常务副校长、教务长、讲席教授 嘉宾简介:张东晓教授,美国工程院院士,杰青,“长江学者”讲座教授,美国地质学会会士,国际石油工程师协会SPE最高荣誉会员。现任北京大学教授,曾任职美国Los Alamos国家实验室,南加州大学及俄克拉荷马大学讲席正教授,北京大学工学院院长、海洋研究院院长、清洁能源研究院院长、研究生院常务副院长,南方科技大学学术副校长兼教务长。从事科学机器学习与智慧能源领域研究,著有专著三本,发表SCI论文270余篇,i10指数220,先后主持或负责重大科研项目40余项。于2018-2022年连续5年获爱思唯尔中国高被引学者;入选美国斯坦福大学2019、2020、2021、2022年度的全球前2%顶尖科学家榜单(World’s Top 2% Scientists),并入选“终身科学影响力排行榜” (1960-2022)。曾任国家海外高层次人才计划联谊会能源、资源和环境专业委员会主任、中国学位与研究生教育学会文理科工作委员会主任、中国学位与研究生教育学会评估委员会副主任。 报告题目:科学机器学习中的知识嵌入与知识发现 内容摘要:科学研究的使命是理解和探索世界,以及根据经验和知识改造世界。其中知识嵌入和知识发现是融合知识和数据的两种重要方法。知识嵌入可以打破知识和数据之间的障碍,从而建立具有物理常识的机器学习模型。人类对世界的理解总是有限的,而知识发现可以利用机器学习从观测中抽提出新知识。知识发现不仅可以帮助研究人员更好地掌握物理学的本质,同时也能对知识嵌入的研究提供有利的支持。通过将知识嵌入和知识发现相结合,可以形成知识生成和使用的闭环,从而提高模型的鲁棒性和准确性,发现未知的科学原理。本报告将讨论目前知识嵌入和知识发现领域的一些进展,以及在力学和能源等领域的潜在发展机遇。 卢宇彤 中山大学二级教授 国家超级计算广州/深圳中心主任 嘉宾简介:卢宇彤,中山大学计算机学院教授,国家超级计算广州/深圳中心主任,国际超算ISC Fellow,国家科技部重点研发计划高性能计算专项总体组专家,国家有突出贡献的中青年专家,科技部“创新人才推进计划”重点领域创新团队带头人,享受国务院特殊津贴,全国三八红旗手标兵。获得国家/省部级科技进步特等奖、一等奖多项,发表论文200余篇,授权专利30余项。主要科研方向为并行与分布式计算、高性能计算与大数据人工智能融合技术与应用。 报告题目:超智融合加速科学工程应用 内容摘要:超级计算一直是推动科学研究、技术突破、产业发展的创新引擎,随着大数据、人工智能技术的快速发展,各领域应用呈现出多模式融合的发展趋势。本报告阐述算力数力智力融合应用支撑技术,分析相关HPC+AI for Science的技术挑战、核心算法以及主流应用的特点,探讨超算与大数据人工智能融合应用新需求给超算体系结构、软件设计所带来的影响,探讨融合应用与系统协同的均衡设计技术和服务化平台软件技术,给出HPC+AI的科学工程应用实例分析。 李飞飞 阿里巴巴集团副总裁 CCF大数据专家委员会副主任 嘉宾简介:ACM Fellow, CCF Fellow, IEEE Fellow。阿里云数据库产品事业部负责人。曾获ACM SIGMOD 2023最佳论文奖,EDBT 2022 Test-of-Time Award,IEEE ICDCS 2020最佳论文奖,ACM SoCC 2019最佳论文奖runner up,IEEE ICDE 2014 十年最有影响力论文奖,ACM SIGMOD 2016最佳论文奖、ACM SIGMOD 2015最佳系统演示奖、世界互联网大会2019全球领先科技成果奖、浙江省科技进步一等奖、中国电子学会科技进步一等奖等。担任多个国际及国内一流学术期刊和学术会议的编委、主席,中国计算机学会CCF大数据专家委员会副主任,数据库专业委员会常委。带领团队研发了以云原生数据库PolarDB为核心的云数据库系统,实现了中国数据库市场份额第一,作为国内唯一数据库厂商连续3次进入Gartner全球云数据库市场分析报告领导者象限。 报告题目:从结构化到多模: 构建云原⽣⼀站式数据库 内容摘要:在云计算时代,云原生分布式数据库因其弹性扩展、高可用、分布式等特性而获得了大量应用。为满足弹性扩展、弹性计算以及按需按量使用等企业级应用需求,云原生数据库需要探索新的体系架构,如通过分布式共享存储shared-storage来实现shared-everything的架构和存储计算分离、基于shared-nothing分布式架构来提供分布式查询和分布式事务处理。同时,金融级高可用、异地多活、以及多源异构的多模数据管理等技术挑战也是云原生数据库必须提供的关键能力。数据库系统在快速的向云原生化、平台化、一体化、智能化的四化方向演进。基于对以上技术挑战的不断探索和实践,我们自研了云原生数据库PolarDB,提供企业级云原生分布式数据库能力,提供一站式一体化的数据库能力。同时我们也自研了企业级云原生数据仓库AnalyticDB(ADB)以及云原生多模数据库Lindorm。PolarDB/ADB/Lindorm经受了阿里巴巴双十一世界级的交易峰值挑战并在阿里云上取得了商业化成功。同时,深度结合机器学习和安全加密等最新技术,提供面对未来下一代企业级应用的智能化、安全的一站式云原生数据平台。 张鹏 智谱AI CEO 嘉宾简介:智谱AI CEO,清华大学2018创新领军工程博士,毕业于清华大学计算机科学与技术系,研究领域包括知识图谱、大规模预训练模型等。作为主要研究人员参与GLM系列大模型、AMiner(https://aminer.cn)、XLORE(http://xlore.org)等项目的研发工作,在ICML、ISWC等顶级会议上发表10余篇文章。长期致力于知识和数据双轮驱动的人工智能框架实用化落地,在大规模预训练模型、语义大数据分析、智能问答、辅助决策等应用领域拥有丰富的实践经验。 报告题目:ChatGLM3:模型、API平台与APP 内容摘要:回顾人工智能的发展热潮,预训练大模型是新一代人工智能应用的基础设施,对大模型研究和应用有重大意义。智谱AI致力于打造新一代认知智能通用模型,使认知大模型具备类人脑的系统思考能力。 智谱AI主导研发了双语千亿级超大规模预训练模型GLM-130B,并基于此千亿基座模型打造了千亿基座的中英文对话模型 ChatGLM(chatglm.cn)。开源的ChatGLM-6B支持在单张 2080Ti上进行推理使用,全球下载超过400万次,持续两周位列Huggingface全球模型趋势榜榜首。智谱AI还提出了Model as a Service(MaaS)的市场理念,推出大模型MaaS开放平台(https://open.bigmodel.cn/),基于领先的千亿级多语言、多模态预训练模型,打造高效率、通用化的“模型即服务”AI开发新范式,实现服务效率的提升。 如今,大模型的智能涌现仍未看到极限,智谱AI在大模型领域的成果可以帮助更多人了解和参与到大模型的开发和使用中来,共同推进技术的发展和创新。 王维强 蚂蚁集团安全实验室首席科学家 蚂蚁大安全机器智能部总经理 嘉宾简介:美国南加州大学计算机硕士和计算材料科学博士。目前任蚂蚁集团安全实验室首席科学家、蚂蚁大安全机器智能部总经理、人工智能研究员,主要研究方向为机器学习AI算法在数字金融风控安全领域的应用,同时负责蚂蚁可信AI技术研究与实践。在KDD、NeurIPS、AAAI等顶级学术会议/期刊发表多篇论文,申请授权专利80+,2023年“浙江省科技进步一等奖”第一完成人 报告题目:大模型时代大数据的应用与安全 内容摘要:2023,大模型技术逐渐普及,AI元年开启。在大模型时代,大数据的应用与安全也面临着新的机遇与挑战,如何解决当下问题让本次报告主要阐述以下三大观点及蚂蚁在安全场景的技术探索实践及成果: 1)大模型时代建模方式已由model centric的方式变成了data centric,如何更高效地利用AI的对海量数据数据进行高效标注,抽取知识,帮助大模型高效训练是我们要解的第一个问题。 2)AIGC规模化应用在使生产效率提升的同时也带来了海量规模的生成数据,如何借助AI能力保障泛内容形态数据的安全合规问题,是我们要考虑的第二个问题。 3)大模型技术给人机协同带来了新的交互形态,我们应该如何借助大模型技术来进行业务安全系统智能化体系升级,是很多金融机构面临的问题,这是我们要讨论的第三个问题。 本次分享我们将介绍针对这三个大模型时代大数据的应用安全问题,介绍我们在蚂蚁安全场景的一些技术探索实践和应用成果。 王士进 科大讯飞副总裁 嘉宾简介:王士进博士,教授级高工,科大讯飞副总裁、教育首席科学家、认知智能全国重点实验室副主任,他带领团队陆续开展了认知智能、大模型等技术及在教育等行业关键技术方向研究,取得一系列国际领先的研究成果,获得30余项国际比赛冠军,获安徽省科技进步一等奖、吴文俊人工智能科技进步奖一等奖、中国科协求是杰出青年成果转化奖等奖项称号。 报告题目:认知大模型的技术阶跃及教育应用思考 内容摘要:本报告首先分析了人工智能的阶段,并提出当前以认知大模型为代表的通用人工智能技术引发全球广泛关注,然后还分析了从认知大模型到多模态大模型的技术特性、发展趋势及应用价值。其次,报告汇报了科大讯飞研发星火大模型的成果和研发经历,最后重点介绍了大模型服务教育行业的探索经验。 大会整体日程安排 大会时间 2023年12月22日-24日 大会地点 广州市·黄埔区·君澜酒店(黄埔国际会议中心) 日期 时间 环节 12月 22日 (周五) 上午 分论坛1:基础大模型 分论坛2:开源数据库 分论坛3:AI+Science 分论坛4:智慧城市 分论坛5:金融科技 分论坛6:数据治理与应用 下午 分论坛7:多模态大模型 分论坛8:大数据与算力基础设施 分论坛9:AI开源框架与算法 分论坛10:交通大数据 分论坛11:工业大数据 2023CCF大数据与计算智能大赛(BDCI)总决赛 12月 23日 (周六) 全天 大会主论坛 晚上 2023 CCF大数据与计算智能大赛(BDCI)颁奖晚宴 12月 24日 (周日) 上午 分论坛12:开源云计算 分论坛13:司法大模型 分论坛14:生物医药大数据 分论坛15:数据要素和数字经济 分论坛16:电磁数据智能认知与智能传输 分论坛17:创新创业投资论坛 分论坛18:数据科学与计算智能 主论坛日程安排 分论坛1:基础大模型 分论坛2:开源数据库 分论坛3:AI+Science 分论坛4:智慧城市 分论坛5:金融科技 分论坛6:数据治理与应用 分论坛7:多模态大模型 分论坛8:大数据与算力基础设施 分论坛9:AI开源框架与算法 分论坛10:交通大数据 分论坛11:工业大数据 分论坛12:开源云计算 分论坛13:司法大模型 分论坛14:生物医药大数据 分论坛15:数据要素和数字经济 分论坛16:电磁数据智能认知与智能传输 分论坛17:创新创业投资论坛 分论坛18:数据科学与计算智能论坛 更多论坛信息待解锁!2023年12月22日-24日,诚邀您共赴这场大数据前沿智慧盛宴! 大会地点:广州市黄埔区君澜酒店 报名地址:https://conf.ccf.org.cn/BDTC2023 (也可以下方扫描二维码进行注册)