返回首页
您的位置:首页 > 新闻 > CCF聚焦

大数据、大算法、大模型与产业发展 | CCDE2023专题论坛

阅读量:1515 2023-03-20 收藏本文

 大数据、大算法、大模型与产业发展 | CCDE2023专题论坛


近年来,大数据和人工智能技术高速发展,成为新一轮科技革命和产业变革的核心驱动力,释放出巨大价值,被广泛应用在工业制造、交通、金融、教育、医疗等各种行业,极大地促进了产业发展。大数据的发展为人工智能的训练和应用提供了海量的数据资源和计算能力,推动了人工智能技术的创新和突破,而人工智能又反过来促进了大数据的分析和利用。大数据和人工智能的发展赋能各行业的数字化转型,提升生产效率和创新能力,推动经济向数字化、网络化和智能化方向发展。为了探讨大数据、人工智能和数据经济产业发展问题,本论坛邀请专家学者分别就大数据、大算法、大模型、数字经济等问题表达自己的观点,并共同探讨如何在大数据和大模型科技和产业竞争中突围。


图片




首届中国数字经济产业发展大会(CCDE2023)将于3月25日在苏州相城举办,大会将涵盖大数据产业、算力发展、数字金融产业、智能网联汽车产业、数字孪生技术、产业数字化、青年创新创业等话题。本文特别介绍将于25日下午举行的大数据、大算法、大模型与产业发展专题论坛


+

+

一、论坛安排


时间:3月25日13:30-17:00

地点:苏州市国际会议酒店(苏州市相城区相融路699号)


+

+

二、论坛议程


时间

议程

嘉宾

13:00-13:30

嘉宾签到

13:30-13:45

领导致辞

黄宜华,CCF大数据专家委员会副主任,南京大学教授、大数据技术研究中心主任

邢鹏,苏州市相城区政府副区长

13:45-14:15

时空大数据联邦计算

童咏昕,CCF杰出会员,北京航空航天大学计算机学院教授

14:15-14:45

工业大数据技术与挑战

王晨,清华大学大数据系统软件国家工程研究中心总工程师、清华四川能源互联网研究院大数据研究所所长

14:45-15:15

认知智能大模型进展及其展望

谭昶,科大讯飞股份有限公司智慧城市事业群副总裁、讯飞大数据研究院院长

15:30-16:00

高通量药物发现人工智能大模型

彭绍亮,CCF杰出会员,国家超级计算长沙中心副主任

16:00-16:15

数据定价

王建冬,国家发展改革委价格监测中心副主任

16:15-17:00

圆桌论坛:中国如何在大数据和大模型科技和产业竞争中突围?

嘉宾:所有讲者

主持:黄宜华,南京大学教授、大数据技术研究中心主任,CCF大数据专家委员会副主任


+

+

三、论坛主席


图片




程学旗

CCF会士、理事、大数据专家委员会秘书长。中国科学院计算技术研究所副所长、研究员,中国科学院网络数据科学与技术重点实验室主任,大数据分析系统国家工程研究中心理事长。


获国家杰出青年科学基金资助四次获得国家科学技术奖励,获授权发明专利92项,发表论文300余篇,六次获得本领域顶级国际学术会议最佳论文奖励,谷歌学术引用两万余次。长期从事网络大数据分析技术研究与工程实践,是我国该领域杰出领军人才。主持研制了四代“天玑”网络大数据分析软件系统,规模化应用于国家安全与情报分析重大工程以及国防、金融和互联网服务等领域,并在大数据分析技术生态与产业化应用方面做出了突出贡献。在国家重大任务需求牵引下,提出广谱关联计算范式并成功应用于网络空间大数据分析,为时期国家战略任务和产业数字化转型升级提供了关键技术支撑。


共同主席:


图片




窦志成

CCF大数据专家委员会副秘书长,中国人民大学高瓴人工智能学院副院长、教授、博导,北京智源人工智能研究院“智能信息检索与挖掘”方向项目经理。


2008加入微软亚洲研究院,从事互联网搜索的相关工作,培养了丰富的信息检索技术研发经验。2014年开始在中国人民大学任教,主要研究方向为智能信息检索和自然语言处理,尤其关注个性化、交互式以及对话式等新一代搜索任务。在国际高水平会议和期刊上发表论文100余篇,曾获国际信息检索大会(SIGIR 2013)最佳论文提名奖,亚洲信息检索大会(AIRS 2012)最佳论文奖,全国信息检索学术会议(CCIR 2018、CCIR 2021)最佳论文奖。担任SIGIR 2019的程序委员会主席(短文),信息检索评测会议NTCIR-16程序委员会主席,中文信息学会信息检索专委会副主任。

图片




王莉

CCF高级会员、大数据专家委常委和副秘书长、人工智能与模式识别专家委委员、协同计算专委委员,太原理工大学教授、博士生导师、人工智能系主任、校学术委员会委员,山西省“大数据智能”科技创新团队负责人。


主要研究领域为大数据挖掘、知识图谱、工业智能等。承担完成科技部重大专项课题、国家基金、863、军科创新、山西省国际合作以及横向委托项目30余项。


+

+

四、报告嘉宾及摘要


图片




童咏昕


【嘉宾简介】童咏昕,CCF杰出会员,北京航空航天大学计算机学院教授,博士生导师,国家自然科学基金优秀青年基金获得者。2014年于香港科技大学获计算机科学与工程学博士学位,随后留校担任研究助理教授,2015年入选北京航空航天大学“卓越百人计划”并加入软件开发环境国家重点实验室工作。目前主要研究方向包括:联邦学习、时空大数据分析与处理、众包计算与群体智能等。近年先后主持国家自然基金重点项目、国家重点研发计划课题等科研项目。共发表学术论文百余篇,谷歌学术引用8000余次。曾获中国电子学会自然科学一等奖(排名1)、首届阿里巴巴达摩院“青橙奖”和多个国际一流学术会议/竞赛的最佳论文与冠军;担任《Frontiers of Computer Science》期刊的执行编委、《IEEE TKDE》与《IEEE TBD》等国际期刊编委和多个CCF-A类会议程序委员会领域主席(PC Area Chair);也是CCF杰出会员、CCF会员与分部工委副主任、CCF走进高校工作组组长。


【报告题目】时空大数据联邦计算


【报告摘要】近年来随着市域社会治理与跨域交通管理等新需求的出现,在促进跨域时空数据流通的同时存在着泄露时空隐私的高风险,进而危害国家安全并影响社会治理。因此,如何在各部门原始数据不出本地的前提下,实现隐私安全的跨域协同分析成为时空大数据计算领域一项全新挑战?联邦计算以其“原始数据不出域、数据可用不可见”的共享理念为破解跨域数据要素流动问题提供了一种全新思路。本报告首先回顾时空联邦计算的背景,从数据库的视角回顾传统联邦数据库概念,介绍隐私可控的时空大数据联邦计算技术。随后介绍本团队结合产业应用需求所研发的时空联邦计算开源平台——“虎符(OpenHufu)”,其已经适配当前各种主流时空大数据计算平台,并支持多方数据自治环境下的安全高效协同查询。最后,报告也将介绍基于虎符系统的应用示范,并对该领域未来发展进行展望。

图片




王晨


【嘉宾简介】王晨,清华大学大数据系统软件国家工程研究中心总工程师、清华四川能源互联网研究院大数据研究所所长,国家产业基础专家委员会委员,参与十四五大数据产业规划等多项国家级、部级信息化与大数据规划编制,领导实施多个制造业龙头企业工业大数据项目。曾担任IBM中国研究院主任研究员,数据管理技术研究部高级经理,IBM全球分析云研究战略负责人。同时在数据领域的顶尖国际会议与期刊上发表了50余篇论文,获得60余项中国、美国发明专利,担任多个学术会议审稿人,担任《大数据导论》、《工业大数据分析指南》、《工业大数据产业与技术白皮书》等多本著作编委。任工信部工业互联网产业发展联盟(AII)副秘书长,北京工业互联网技术创新与产业发展联盟秘书长,中国计算机学会数据库专委会委员,产学研工作组副组长,中国自动化学会大数据专委会委员,ACM SIGBED China常务委员,全国信标委工业APP工作组副组长、大数据工作组工业大数据专题组组长,国家工业信息安全发展研究中心科技委委员,Apache基金会IOTDB项目PMC,工信部工业强基、工业互联网等专项评审专家。曾获得北京市科技进步一等奖(2020),日内瓦发明金奖(2022)等科技奖励。


【报告题目】工业大数据技术与挑战


【报告摘要】伴随着工业互联网和制造业数字化转型的发展趋势,工业大数据技术在产业界和学术界获得了越来越多的关注。围绕产品制造与服务对工业互联网数据实时感知的迫切需求,面向工业互联网传感器精度低、资源受限制、设备故障频发、网络传输稳定性差、复杂环境干扰等难题,开展工业互联网数据感知技术研究,包括复杂环境感知数据质量保障方法、机器数据端云协同感知、边缘数据采样与压缩存储等。针对工业互联网机器数据采集环境恶劣、超高通量采集、低质乱序传输等特点,首创机器时序数据列式存储格式,提出了时序数据新型编码压缩、乱序处理、列式连接、高效聚合等方法,设计了基于统一列式存储文件的端云数据同步架构,形成了独创的机器数据端云协同感知与压缩存储技术。建立了机器数据端云协同感知、压缩存储、乱序处理等技术,形成了多变性机理约束容忍的数据质量理论和过程时序数据治理算法。围绕复杂装备跨设计制造与服务保障生命周期中多模态数据的一体化管理需求,针对设计制造BOM和服务实例BOM之间结构失配、多模态产品数据集成、跨业务跨主体数据安全访问等技术难题,开展复杂装备跨生命周期数据管理技术研究,提出了基于中性BOM模型和多维文件空间模型的多类型数据统一表示方法。针对大数据统计分析和机器学习技术在工业场景下面临着复杂场景适应能力不足导致分析模型泛化性和准确性欠缺、数据方法反向统计分析与正向工业机理演绎难以融合以及工业过程中各类扰动带来的知识确定性丧失等难题,建立机理与知识融合的工业大数据分析理论方法,突破对大量相似差异化场景具有强泛化能力的机器学习理论,创立了面向开放差异化工业场景的强泛化可迁移机器学习理论与方法,解决高维任务和复杂结构的知识关联融会迁移难题,探索偏微分方程等机理模型、控制逻辑等工业知识与神经网络、强化学习等数据分析模型的深度融合机制。基于上述技术的突破,完全自主研发的工业物联网数据库软件IoTDB,成为Apache基金会该方向唯一的顶级项目,在国内外200多家企业得到应用。

图片




谭昶


【嘉宾简介】谭昶,中国科学技术大学计算机专业博士,正高级工程师,现任科大讯飞股份有限公司智慧城市事业群副总裁兼讯飞大数据研究院院长。负责科大讯飞公司智慧城市、智慧交通、计算广告和个性化推荐等方向的大数据核心技术研发及应用推广工作。主要学术任职为中国计算机学会大数据专委会常委、人工智能专委会执委。


【报告题目】认知智能大模型进展及其展望


【报告摘要】报告首先回顾人工智能发展阶段,介绍认知智能阶段的共性技术和典型应用,指出认知智能大模型是认知智能技术突破的重要方向。报告也系统分析了ChatGPT智慧涌现的特点及其背后的技术支撑,指出ChatGPT的成功是“数模算用”的系统性工程。最后结合讯飞实践给出中文大模型的可行性分析和建设思路,对大模型未来的产业化应用作一展望。

图片




彭绍亮


【嘉宾简介】彭绍亮,CCF杰出会员,国家超级计算长沙中心副主任,湖南大学"岳麓学者"二级教授/博导。从事大数据、生物信息、人工智能、区块链等技术研究。出版学术专著7部,在Nature Machine Intelligence等期刊发表学术论文200余篇,论文引用8000余次。主持参与天河系列超级计算机应用软件研发工作,国家科技部、自然科学基金委重点项目,973/863项目等13项。获2019年国家科技进步二等奖,2019年湖南省技术发明一等奖(排名1),2013年军队科技进步一等奖1项,2021年CCF技术发明二等奖(排名1),2018年CCF自然科学二等奖(排名1),2016年立三等功。是中央军委科技委生物交叉立项专家组成员、国家科技部/工信部/教育部会评专家、中国计算机学会理事、CCF计算机应用和生物信息专委副主任和YOCSEF总部AC委员、CCF高性能计算专委常委、大数据专委常委、区块链专委委员,CCF杰出会员和杰出3星演讲者(CCF第二个)、湖南省生物信息学会理事长(发起人),担任2个SCI期刊执行主编和多个国际期刊副主编等。2020年联合创立全球第一个《Metaverse》元宇宙国际学术期刊,任Editor-in-Chief(主编),获得2022世界元宇宙生态大会元宇宙领军人物奖和2022“元宇宙30人创新人物奖”。


【报告题目】高通量药物发现人工智能大模型


【报告摘要】以AlphaFold为代表的人工智能药物发现(AIDD)技术提升了高通量数据产生和药物研发能力。由于广阔的结构空间、多变的生化性质、和训练数据稀疏导致的过拟合,导致现有AIDD技术存在海量高维异构数据、标注数据少、泛化能力弱、模型可解释性差、计算复杂度高等问题。团队基于海量的多源异构生物医药大数据,研究了高通量药物发现大模型关键技术。建立多任务协同预训练大模型,深度提取了融合分子结构和生物相互作用机制的多视图药物表征;研究了多模态联合深度学习技术,获得具有可解释性的节点嵌入表示,提升了AIDD模型的可解释性,还解决了已有方法不能预测训练数据集之外的样本问题,从而进行大规模精准药物发现(包括疾病分型、敏感性、不良反应、毒性等);研发了高通量虚拟药物筛选并行算法与分子测试技术,并实现了候选药物筛选和生物测试。形成一个从药物分子表征和生物异质网络到精准药物发现,再到靶标药物快速筛选和测试的全链条人工智能药物发现技术体系。实现了高通量药物大数据和人工智能双驱动下的干湿实验闭环研究,探索了大模型、人工智能和多模态大数据驱动下的药物研发新技术体系。




大会组委会特别邀请对大数据、大算法、大模型与产业发展”等核心问题感兴趣或有经验、有想法的专业人士参加本次大会。因有苏州市相城区人民政府特别资助,参会者无需交费。大会场地有限,除特邀嘉宾外,其他嘉宾需提前报名才能参会。



请扫描或识别下面的二维码报名参会

图片

扫描大会二维码报名