CNCC | 第四届高能效图计算架构和系统软件论坛邀你共议图计算现状及发展趋势
CNCC2024
论坛简介:
第四届高能效图计算架构和系统软件——新型图计算应用和支撑技术
举办时间:10月24日13:30-17:30
地点:秋苑-教室区(东5)
注:如有变动,请以官网(https://ccf.org.cn/cncc2024)最终信息为准
图计算作为分析事物之间关联关系的重要工具,已广泛地应用于社会治理、医疗健康、电网分析、计算材料、计算育种、EDA等众多领域。然而,近年随着人工智能等蓬勃发展,数据之间的关联关系变化速度日益加快,数据自身及其关联关系的附属信息也日益丰富。为了从这些数据中获取有用信息,新型图计算应用(例如:图神经网络、流图计算、超图计算)涌现,图计算需求日益复杂多样。
论坛亮点
讨论图计算应用新需求及其发展趋势
讨论如何高效支撑这些新型图计算应用场景,助力图计算技术发展和生态成熟
论坛日程
顺序 | 主题 | 主讲嘉宾 | 单位 |
1 | Neutron:大规模图学习的训练推理加速 | 张岩峰 | 东北大学 |
2 | GraphUniverse:一个支持图实时存储、查询、分析和学习的统一系统 | 洪春涛 | 蚂蚁集团 |
3 | 文本属性图上的少样本和零样本节点分类 | 江佳伟 | 武汉大学 |
4 | GOFA:一种生成式图基础模型 | 张牧涵 | 北京大学 |
5 | 图查询和分析的一些反思和新技术 | 郑卫国 | 复旦大学 |
Panel环节 | 张岩峰 | 东北大学 | |
洪春涛 | 蚂蚁集团 | ||
江佳伟 | 武汉大学 | ||
张牧涵 | 北京大学 | ||
郑卫国 | 复旦大学 |
论坛主席及嘉宾介绍
论坛主席
张宇
华中科技大学教授
华中科技大学计算机科学与技术学院教授,博导,国家级青年人才计划入选者,主要研究高性能图计算、体系结构和系统软件,主持多项图计算相关的国家和企业项目,在ISCA、MICRO、HPCA、ASPLOS、DAC、SC、EuroSys、USENIX ATC等CCF A/B类和IEEE/ACM Transactions上发表论70余篇,成果应用于华为等多家龙头企业,获评CCF高性能计算“卓越青年”、ACM中国新星奖(全国奖)、中国智能计算科技创新人物、英特尔中国学术英才计划荣誉学者等。
论坛共同主席
邹磊
北京大学教授
北京大学王选计算机所教授,大数据分析与应用技术国家工程实验室(北京大学)知识集成和智能决策中心主任,主要研究图数据库,知识图谱,尤其是基于图的知识图谱数据管理,面向知识图谱的自然语言问答,图分析与机器学习,大数据系统;在SIGMOD, VLDB, ICDE, TODS, TKDE, VLDB Journal等国际顶级学术期刊和会议上发表论文50余篇,曾获国家自然科学基金优秀青年基金,国家重点研发计划,英国皇家学会牛顿高级访问学者基金资助,获2017年教育部自然科学二等奖。
论坛讲者
张岩峰
东北大学教授
博士生导师,东北大学与美国麻省州立大学联合培养博士,国家级青年人才计划入选者。研究方向为数据库系统、机器学习系统等。曾获CCF自然科学二等奖、SOCC杰出论文奖、华为年度优秀项目奖等奖励。
报告题目:Neutron:大规模图学习的训练推理加速
报告摘要:图学习将深度学习的学习能力和图结构的关联关系抽象能力结合起来,可以更好地利用图网络结构进行精细建模和深度推理。由于图学习训练推理所涉及的计算复杂度非常高,加之社交网络、金融网络等真实图数据规模非常庞大,所以大规模图学习的训练推和理都非常耗时。本报告将分享讲者在构建大规模图学习训练推理系统Neutron中的一些经验,并介绍图学习训练推理加速的一些关键技术。
洪春涛
蚂蚁集团图计算部门负责人
于2011年毕业于清华大学计算机系,主要从事并行计算和高性能计算研究;后加入微软亚洲研究院从事分布式系统和大规模机器学习研究;2016年联合创建了北京费马科技有限公司,研发了TuGraph图数据库,多次打破图数据库性能测试LDBC SNB世界纪录;2020年加入蚂蚁集团,目前主持蚂蚁图计算部门工作。
报告题目:GraphUniverse:一个支持图实时存储、查询、分析和学习的统一系统
报告摘要:自上世纪70年代以来,二维表一直是数据存储的主要结构,无论是关系数据库、数据仓库还是数据湖,都普遍采用二维表作为核心数据组织形式。然而,二维表并非数据的自然表示方式,这也引发了“关系数据库并不能真正表示关系”的讨论。相比之下,图作为一种数据抽象,更加贴近现实世界的关联关系。我们提出将图作为数据的主要抽象,并将图数据库作为主要数据存储,为查询分析提供支持。基于这一理念,我们设计了GraphUniverse,这是一个支持图实时存储、查询、分析和学习的统一系统。通过采用统一的图抽象,GraphUniverse能够避免二维表模型中常见的数据冗余和不一致问题,能够快速提供更复杂的关联关系分析。我们将讨论GraphUniverse的设计理念,架构和未来规划。
江佳伟
武汉大学教授
武汉大学计算机学院教授,国家级青年人才计划入选者。从事数据库、图计算、联邦学习等领域的研究工作,发表高水平论文40余篇,出版专著2部,申请发明专利10余项。获得CCF优博、ACM全国新星提名等奖项。主持国家重点研发计划课题、国家自科基金面上项目、湖北省重点研发计划、CCF-蚂蚁科研基金等项目。
报告题目:文本属性图上的少样本和零样本节点分类
报告摘要:由于缺乏监督信号,文本属性图(TAG)上的少样本和零样本节点分类任务具有挑战性。现有方法通常使用对比损失来对齐基于图的节点嵌入和基于语言的文本嵌入,我们提出的Hound通过引入更多监督信号来提高准确性。具体来说,我们设计了三种增强技术:节点扰动通过添加/删除边以产生可以与文本匹配的多样化节点嵌入;文本匹配通过检索具有相似嵌入的文本以与节点匹配;语义否定使用否定提示来构建具有相反语义的否定文本。实验结果表明,Hound的性能始终优于基线方法,其准确率通常比表现最佳的基线提高5%以上。
张牧涵
北京大学助理教授
张牧涵博士,北京大学人工智能研究院助理教授,国家级青年人才计划入选者。主要研究方向为图机器学习和大模型推理。代表作为链路预测的经典算法SEAL(被引用超过2000次),图分类的DGCNN算法(被引用超过1500次)等。
报告题目:GOFA:一种生成式图基础模型
报告摘要:基础模型,如LLM或LVM,已成为各自领域中最强大的工具之一。然而,与文本和图像不同,图(graph)数据没有固定的结构,这为开发图基础模型(GFM)带来了巨大挑战。目前的图基础模型要么将图数据转化为语言格式以利用LLM进行预测,要么仍然使用LLM作为辅助来训练GNN模型。前者能处理无限任务,后者能更好地捕捉图结构,但尚无模型能够同时实现两者。为解决这一问题,我们提出了生成式图基础模型GOFA,将GNN层与LLM层有机结合,实现了强大的零样本学习能力。
郑卫国
复旦大学青年研究员
复旦大学博士生导师,上海互联网大数据工程技术研究中心副主任。主要从事图数据查询和分析、知识管理、向量计算等相关研究工作,在国际顶级学术会议与期刊发表论文50余篇,包括SIGMOD、VLDB、ICDE、KDD、ACL、TODS、TKDE等,编写知识图谱专著1部;担任VLDB、KDD、ICDE、TKDE、VLDBJ、TKDD、TOIS等会议的程序委员会委员和期刊审稿人,指导学生多次在国内外顶级学术竞赛获得冠军或一等奖。
报告题目:图查询和分析的一些反思和新技术
报告摘要:图因其直观、强大、灵活的表示能力,被广泛用于建模各个应用领域,包括金融、电信、社交网络等,然而图的规模越来越大、结构愈发复杂,对于高效的图查询和分析提出了巨大挑战。图数据上的查询和分析任务、算法异常丰富,然而很多算法都针对某一算法进行针对性的特别优化,适用场景有一定限制,本次报告将介绍在图数据集合求交、子图匹配两个方面的研究进展和一些思考。
关于CNCC2024
CNCC2024将于10月24-26日在浙江省东阳市横店镇举办,大会主题为“发展新质生产力,计算引领未来”。大会为期三天,包括18个特邀报告、3个大会论坛、138个专题论坛及34场专题活动和100余个展览。图灵奖获得者、两院院士、国内外顶尖学者、知名企业家在内的超过800位讲者在会上展望前沿趋势,分享创新成果。预计参会者超过万人。