模型驱动创新,数据生成未来 | CCF BigData 2024特邀报告亮点聚焦
8月9日–11日 | 青岛 · 青岛李沧华邑酒店。
第十二届CCF大数据学术会议CCF BIGDATA 2024
8月9日–11日 | 青岛 · 青岛李沧华邑酒店
主办单位:CCF
承办单位:CCF大数据专家委员会,山东大学
协办单位:中国海洋大学,中国石油大学(华东),青岛大学,山东科技大学,山东师范大学,济南大学,齐鲁工业大学,山东建筑大学。
会议简介
CCF大数据专家委员会(简称大专委)于2012年10月在北京成立。旨在探讨大数据的核心科学与技术问题,推动大数据学科方向的建设与发展;构建面向大数据产学研用的学术交流、技术合作与数据共享平台,并对相关政府部门提供战略性的意见与建议。CCF大数据学术会议由大专委承办,是国内大数据领域最具影响力的学术会议之一,已成功举办11届。第十二届会议(CCF BigData 2024)将于2024年8月9–11日在青岛举行,由山东大学共同承办。
CCF大数据学术会议特邀报告汇集行业顶尖专家,深入探讨大数据与人工智能的最新突破与未来方向。把握学术前沿,洞见技术趋势,在这里我们将与知名专家学者面对面交流,开启思维的碰撞。
主论坛嘉宾揭晓
华云生
香港中文大学教授、常务副校长
Benjamin W. Wah is a Research Professor at the Chinese University of Hong Kong, and Franklin W. Woeltge Professor Emeritus of Electrical and Computer Engineering at the University of Illinois, Urbana-Champaign. Previously, he served as the Provost and Wei Lun Professor of Computer Science and Engineering of the Chinese University of Hong Kong, as well as the Franklin W. Woeltge Endowed Professor of Electrical and Computer Engineering and Professor of the Coordinated Science Laboratory of the University of Illinois, Urbana-Champaign, USA. Wah received his Ph.D. degree in computer science from the University of California, Berkeley, CA, in 1979. He has received many awards for his research and service contributions, including the IEEE-CS W. Wallace-McDowell Award (2006), the IEEE-CS Richard E. Merwin Award (2007), the IEEE-CS Tsutomu Kanai Award (2009), the Distinguished Alumni Award in Computer Science of the University of California, Berkeley (2011), and the Bronze Bauhinia Star of the Hong Kong Self Administrative Region (2021). Wah's research interests are nonlinear search and optimization, multimedia technologies, and artificial intelligence. Wah co-founded the IEEE Transactions on Knowledge and Data Engineering in 1988 and served as its Editor-in-Chief between 1993 and 1996. He is the Co-Editor-in-Chief of Computers and Education: Artificial Intelligence and the Honorary Editor-in-Chief of Knowledge and Information Systems. In addition, Wah served the IEEE Computer Society in various capacities, including Vice President for Publications (1998 and 1999) and President (2001). He is a Fellow of the AAAS, ACM, and IEEE.
报告题目:Objective Modeling of the Big-Data Problem On Perceptual Quality for Fast Interactive Multimedia Games
With advances in multimedia technologies, many interactive online games have been developed. However, the quality experienced by users when playing cloud-based games over the Internet varies because network delays may render the response in these games sluggish, slow, or non-responsive. In this presentation, we study the objective modeling of the perceptual quality of interactive multimedia games. Optimizing perceptual quality is an ill-defined big-data problem and depends on many network- and application-dependent parameters. We first examine the hundreds of standards the International Telecommunications Union (ITU-T) developed for measuring multimedia perceptual quality over the Internet. Examples of the standards include the Mean Opinion Score (MOS), the E-model, Quality of Experience (QoE), and Quality of Service (QoS). These measures are application-specific and rely on quantitative metrics collected in real time. Moreover, they are expensive to obtain and may require subjective tests under specific operating conditions. This presentation presents a new objective-based approach that optimizes perceptual quality in real-time cloud-based interactive games. We develop control strategies to hide network delays to let users perceive that they run their games on networks with much lower delays. Finally, we show examples illustrating the results.
李国杰
CCF会士、名誉理事长,中国工程院院士,中国科学院计算技术研究所研究员
李国杰,主要从事计算机体系结构、并行算法、人工智能、计算机网络、信息技术发展战略等方面的研究,发表论文100多篇,合著英文专著4本,出版了报告论文集《创新求实录》。1995年当选中国工程院院士,2002年当选第三世界科学院院士。主持研制成功曙光1号并行计算机、曙光1000大规模并行机和曙光2000/曙光3000超级服务器,领导研制成功曙光4000超级服务器、曙光5000A高效能计算机,其中,曙光1号获1994年中国科学院科技进步特等奖和1995年国家科学技术进步二等奖;曙光1000获得1996年中国科学院科技进步特等奖和1997年国家科学技术进步一等奖。曙光2000和曙光3000分别获得2001年和2003年国家科技进步二等奖。领导推动计算所研制成功我国多个系列通用CPU、智能处理器以及开源芯片,并成功产业化。
1994年获得首届何梁何利基金科技进步奖,1995年被评为国家级有突出贡献的中青年专家,1999年获潘文渊研究杰出奖,2000年被评为全国先进工作者,2001年获得美国普渡大学电机学院杰出校友奖,2006年获得首届信息界学术大会最高学术大奖。曾任第九届、十届全国人大代表,中共十七大代表、国家信息化专家咨询委员会信息技术与新兴产业专委会副主任、英文版学报《Journal of Computer Science and Technology》主编、中国科学院学位委员会副主席、中国科学院大学计算机与控制学院院长等职。现兼任中国计算机学会名誉理事长。
吴立新
中国科学院院士,崂山实验室主任,中国海洋大学副校长
吴立新,第十三、十四届全国人大常委,中国科学院院士、发展中国家科学院院士、欧洲科学院院士、美国地球物理学会会士、美国气象学会会士,现任崂山实验室主任,中国海洋大学副校长,青岛市政协副主席。长期致力于海洋动力过程与气候、海洋地球系统观测、模拟与预测研究。
吴立新依托崂山实验室,领导发起了“透明海洋”研究计划,推动海洋超算、“两洋一海”立体观测系统等多项重大工程的实施,是国家自然科学基金委西太平洋重大研究计划、科技部十四五海洋环境重点研发专项的专家组组长。
吴立新因在“跨尺度海洋动力过程与气候”研究领域的杰出成就与领导力,2019年获得美国地球物理学会地球与空间科学领导力最高奖,是首位获此殊荣的亚洲科学家,也是首位成为美国地球物理学会会士的中国海洋学家;2024年荣获全球物理海洋学家最高荣誉——美国气象学会亨利斯托梅尔研究奖章,成为该奖设立30年来首次获此荣誉的亚洲科学家。
报告题目:海洋大数据与数字孪生
海洋是地球气候的调节器,是连接地球系统各圈层的纽带。由于海洋系统复杂的跨尺度、跨圈层相互作用,传统的理论和观测研究无法满足认识与经略海洋的重大战略需求。近年来,随着观测技术与计算能力的提升,以多源观测数据为基础、精细化数值模拟为基石、高性能计算为支撑、人工智能为强化的海洋数字孪生理论和技术体系,已经成为深入认识海洋系统演化机理、准确预测预报海洋系统变化的核心手段。海洋科学正在从传统的知识驱动向知识-数据融合驱动的新研究范式跨越。本报告回顾了海洋数字孪生的发展历史、当前面临的挑战与瓶颈、以及人工智能在海洋数字孪生领域取得的最新进展,并对海洋数字孪生的发展前景进行了展望。
蒋昌俊
CCF会士,中国工程院院士,同济大学讲席教授
蒋昌俊,计算机专家,中国工程院院士。同济大学讲席教授、Brunel University London名誉教授、英国工程技术学会会士、国家杰青、973首席科学家、全国优秀科技工作者、全国创新争先奖状获得者等。成果获中、美、德等国发明专利106件、国际PCT 22件;发表论文300余篇(含ACM/IEEE汇刊100余篇),中英文专著5本;获国家技术发明二等奖1项(排1)、国家科技进步二等奖2项(均排1)、HO PAN CHING YI Award(独立)等。
他长期致力于网络计算方面的研究,相关成果被美国、英国、德国、瑞典、印度等国家院士等知名专家正面评价和引用,主持建立了我国首个网络交易风险防控体系、系统及标准,为我国在该领域成为国际“领跑者”做出了开拓性贡献。
报告题目:智能算网系统
报告首先介绍国家东数西算重大战略背景,分析其现状和问题;接着介绍方舱计算的架构和特点,由此与东算西算固定网形成舱网融合的智能算网系统,分析它的创新优势,演示同济智能算网系统;最后,指出它的三步走计划及未来前景。
马毅
香港大学教授、数据科学研究院首任院长、计算机科学系主任
Yi Ma is a Chair Professor in Artificial Intelligence, the inaugural director of the Data Science Institute, and the head of the Computer Science Department of the University of Hong Kong since 2023. His research interests include computer vision, high-dimensional data analysis, and integrated intelligent systems. Yi received his two bachelor’s degrees in Automation and Applied Mathematics from Tsinghua University in 1995, two master’s degrees in EECS and Mathematics in 1997, and a PhD degree in EECS from UC Berkeley in 2000. He has been on the faculty of UIUC ECE from 2000 to 2011, the principal researcher and manager of the Visual Computing group of Microsoft Research Asia from 2009 to 2014, and the Executive Dean of the School of Information Science and Technology of ShanghaiTech University from 2014 to 2017. He joined the faculty of UC Berkeley EECS in 2018. He has published over 65 journal papers, 145 conference papers, and 3 textbooks on computer vision, generalized PCA, and high-dimensional data analysis. He received the NSF Career award in 2004 and the ONR Young Investigator award in 2005. He also received the David Marr prize in computer vision from ICCV 1999 and best paper awards from ECCV 2004 and ACCV 2009. He has served as the Program Chair for ICCV 2013 and the General Chair for ICCV 2015. He is a Fellow of IEEE, ACM, and SIAM.
报告题目:Transparent and Consistent Deep Representation Learning: from black-box to white-box, from open-loop to closed-loop
In this talk, we provide a systematic explanation to the practice of deep neural networks in the past decade from the perspective of compressive data encoding and decoding. We argue that the most fundamental objective of learning (or intelligence) is to learn a compact and structured representation of the distribution of sensed data. Goodness of the final learned representation can be measured by a principled quantity known as the information gain, computable by (lossy) coding rates of the learned features. We contend that unrolled iterative optimization of this objective provides a unifying white-box explanation to almost all past and current deep neural networks widely adopted in the practice of artificial intelligence, including ResNets and Transformers. We will show with compelling theoretical and empirical evidence that, mathematically interpretable, practically performant, and semantically meaningful deep networks are now within our reach. Furthermore, our study shows that for the learned representation to be correct and consistent, one needs to close the loop of the encoding and decoding networks, instead of the current practice of training them end-to-end as separated open-loop networks. Probably most importantly, this new framework reveals a much broader and brighter future for developing next-generation efficient and autonomous learning architectures and systems that could truly emulate the computational mechanisms of memory creation.
朱军
清华大学教授
朱军,清华大学计算机系博世AI教授、IEEE/AAAI Fellow。2001到2009年获清华大学计算机学士和博士学位,之后在CMU做博士后和项目科学家,曾任卡内基梅隆大学兼职教授。主要从事机器学习研究,在国际重要期刊与会议发表论文百余篇。担任IEEE TPAMI的副主编,ICML、NeurIPS、ICLR、IJCAI、AAAI等国际会议的资深领域主席、地区联合主席、评奖委员会委员、研讨会主席等。获陈嘉庚青年科技奖、中国科协求是杰出青年奖、第二届科学探索奖、吴文俊人工智能自然科学一等奖、CCF自然科学一等奖、ICLR杰出论文奖、ICME/IEEE CoG最佳论文奖等,入选国家高层次人才计划、MIT TR35中国先锋者以及IEEE Intelligent Systems评选的“AI’s 10 to Watch”。研制Vidu视频大模型,以及开源的“珠算”深度概率编程库和“天授”强化学习库。
报告题目:扩散模型:不止于高维数据生成
生成式模型(AIGC)发展迅速,扩散概率模型是AIGC的关键技术之一,在跨模态的文图生成、3D生成、视频生成等方面取得显著进展。该报告将介绍基于扩散模型的高维数据生成,包括扩散概率模型的基础理论和高效算法、大规模多模态扩散模型、3D生成和视频生成等内容。最后,还会介绍基于预训练扩散模型的鲁棒分类以及利用扩散模型的离线强化学习等内容。
李航
字节跳动研究部门负责人
李航,字节跳动研究部门负责人。ACM Fellow, ACL Fellow, IEEE Fellow。京都大学毕业,东京大学博士。曾就职于 NEC 公司中央研究所,微软亚洲研究院,华为技术有限公司诺亚方舟实验室。主要研究方向自然语言处理、信息检索、机器学习、数据挖掘。
报告题目:大语言模型、智能体与通用人工智能
语言大模型开启了人工智能的新时代,其达到的智能水平令人惊叹,更重要的是实现了AI技术的整合。我们现在可以通过一个统一的框架和手段来构建各种智能系统。这一统一框架是强化学习智能体,而统一手段则包含了Transformer、GPT等技术。
在本报告中,我将分享自己对语言大模型(LLM)、强化学习智能体(RL Agent)以及通用人工智能(AGI)的一些观点,并介绍ByteDance Research最近的一些相关工作。以下是几个主要观点:1. 从RL Agent的角度可以统合所有AI技术。事实上,LLM可以看作是一种基于语言模型的RL Agent,具备语言和心智语言的生成能力。2. 可以将LLM与人类的交互形式化为基于语言的博弈,这个观点可以帮助我们开发出更强的LLM,如提升LLM的对齐能力。3. 将LLM与在形式语言上的推理相结合,能够形成更强的数学推理能力。4. 在LLM的基础上可以构建RL Agent,具有两层信息处理结构,以LLM为核心,内存、工具和多模态处理等为模块。如果LLM对应于System 1,那么这样的RL Agent则对应于System 2。
郑宇
京东集团副总裁,教授
郑宇教授,京东集团副总裁、京东科技首席数据科学家、IEEE Fellow、美国计算机学会杰出科学家,ACM数据挖掘中国分会(KDD China)主席,教育部长江学者、国家万人计划科技创新领军人才、享受国务院政府特殊津贴专家,以及上海交通大学讲座教授、南京大学、香港科技大学等高校的兼职教授和博导。他提出了城市计算,发表CCF-A类论文百余篇,被引用5.6万余次,H-index 105;获得数据挖掘领域SIGKDD Test-of-Time Award(两次)、时空数据领域SIGSPATIAL 10-Year-Impact Award(四次),根据AI2000全球学者影响力排名,在数据挖掘领域连续多年位列中国第一。先后担任人工智能顶尖国际期刊ACM TIST的主编、国家重点研发计划项目首席科学家、总负责人,以及ICDE 2014、CIKM 2017程序委员会主席和IJCAI2019工业界主席。作为大陆首位受邀学者在国际人工智能顶尖会议AAAI2019上发表主旨演讲。他带领团队设计和研发的智能城市操作系统成为雄安新区的数字底座,经国家批复,雄安的智能中枢以“雄安城市计算中心”命名。
报告题目:城市计算:释放城市数据要素价值
城市计算以数据为中心构建智慧城市技术体系,通过城市感知、数据管理、数据分析和服务提供四大共性环节,构建形态各异的上层应用,应对城市业务的不断演进。基于城市计算理论体系打造的城市操作系统包括全域感知、高效管理、智能引擎、跨域学习、数字孪生和城市知识体系等核心能力,可为数字中国战略提供数字基础设施,自动形成与应用分离、可共享的数据资源体系。城市操作系统作为雄安等十余个城市的数字底座,实现了城市数据一网共享,支撑了南通、上海普陀等城市的城市治理一网统管,以及首都的政府运行一网协同系统。本报告介绍从城市计算理论体系到城市操作系统的产品研发、再到其产业实践的过程,分享其中的科学问题、关键技术和落地案例。