【CCF会员故事-19】浙大陈华钧:精耕知识图谱——在CCF寻找志同道合的朋友
“CCF提供了一个宽松、自由、开放的产学研交流平台,在这里很容易能找到志同道合的朋友”,陈华钧谈到CCF对自己的帮助如是说。他的主要研究方向是知识图谱,近年他先后在中国计算机大会(CNCC)、CCF YOCSEF、CCF青年精英大会、CCF中国信息系统大会等多个CCF平台上组织多次知识图谱相关专题论坛或作为演讲嘉宾做专题学术报告。其中在CNCC2018上作为论坛主席组织的“知识图谱赋能数字经济论坛”单场峰值达到800人,并获得CNCC2018十佳优秀论坛和CCF YOCESF 2018-2019年度优秀报告会。
知识图谱赋能数字经济论坛获评CNCC2018十佳优秀技术论坛
专注知识图谱研究
陈华钧与知识图谱的结缘,起于在浙大读博时导师扔给他的两百多篇有关知识表示与知识工程的经典论文。知识图谱的早期理念源自万维网之父Tim Berners Lee关于语义网(The Semantic Web)的设想,实际上是上一代以知识工程为核心的人工智能技术与互联网、万维网等技术相互补充并融合发展的产物。陈华钧基于当时的语义网技术研制了第一个中医药语义搜索引擎。这项工作在国际语义网大会ISWC2006上由五百多名参会代表现场投票获得最佳论文奖,并入选国际万维网联盟W3C语义网技术十大应用示范,随后也获得了教育部高等学校科学研究优秀成果奖技术发明奖一等奖等科技奖励。
探索知识图谱产学研合作
在做好学术研究的同时,陈华钧也积极与众多企业合作拓展知识图谱技术的产业落地应用。例如,他与阿里巴巴的朋友合作,自2014年起几乎是从零开始,协助阿里逐渐搭建起商品知识图谱的核心技术平台。如今,阿里商品知识图谱已经包含60+亿实体、600+亿条三元组和300+万条业务规则,服务于大润发、饿了么、盒马、淘宝、天猫、天猫超市、阿里云、支付宝等二十多个阿里业务场景。阿里商品知识图谱也获得了由CCF主办的中国大数据技术大会BDTC最佳应用实践奖。2018年,阿里巴巴联合清华大学、浙江大学、中科院和苏州大学等发起藏经阁(知识引擎)研究计划,旨在驱动用知识发现商业价值的电商应用研究。同时,浙江大学还与阿里巴巴成立知识引擎联合实验室,聚焦知识图谱前沿技术的研究、产业化落地应用和知识图谱开源开放工作。双方的合作也获得了阿里巴巴优秀学术合作奖,并得到了国家自然科学基金委大数据重大研究计划等多个重点重大项目的支持。在2018年的CCF发布的中国计算机科学技术发展报告中,陈华钧也代表CCF信息系统专业委员会牵头撰写了《知识图谱的系统工程观》的专题章节,系统性总结和介绍了知识图谱的技术前沿和产学研最新进展。
阿里巴巴在2018年首届学术年会上启动藏经阁(知识引擎)研究计划
浙江大学阿里巴巴知识引擎联合实验室
发起OpenKG:开放知识的中文力量
开放促进互联、链接创造价值,开源开放是促进知识图谱领域深入发展的必由之路。国际上已有众多的开放知识项目,如欧洲的开放知识基金会、英文领域最大规模的开放知识图谱Wikidata、发展多年的Linked Open Data项目等。基于中文开放领域知识图谱构建不能落后且只能依靠中文社区构建的考虑,陈华钧团结一些在知识图谱一线工作的朋友于2016年发起了OpenKG中文开放知识图谱社区项目。OpenKG旨在促进以中文为核心的知识图谱数据的开放与互联,同时促进知识图谱算法模型和工具的开源开放,以及知识图谱与语义技术普及与广泛应用。OpenKG先后推动了中文知识图谱开放资源共享平台OpenKG.CN、链接的中文百科开放图谱、cnSchema中文图谱开放Schema、开放图谱众包平台Openbase、新冠病毒开放知识图谱等多个项目的合作研发。如今,OpenKG已经汇聚了数十亿三元组的中文知识图谱数据资源及大量开源图谱算法和工具。此外,OpenKG组织编写的《知识图谱:方法、技术与实践》也获得博文视点2019最具震撼力图书大奖。
在CNCC2017知识图谱论坛上做《OpenKG与cnSchema》专题报告
在2018阿里巴巴云栖大会上介绍OpenKG
陈华钧也积极利用CCF的多个平台助力OpenKG的发展与宣传。例如作为CCF计算机术语审定工作委员会执委,和CCF的众多伙伴一起探索开放术语众包的机制和技术;在每年的CNCC大会的知识图谱技术论坛上,都安排有OpenKG的专题报告等等。
参与CCF计算机术语审定工作委员会的工作
未来努力:深耕知识图谱
陈华钧认为知识图谱作为传统人工智能与互联网融合发展的产物,还会进一步与深度学习、自然语言处理、区块链等领域的新技术进步进一步融合,并与感知层的视觉知识、认知层的语言知识进一步结合,为人类知识的沉淀和积累提供更好的表示方法和呈现载体。同时开放是知识的内生属性,也是知识累积和沉淀的必要条件。因此,他勉励自己要继续坚持在这个历史悠久但却方兴未艾的技术领域深耕细耕,瞄准知识图谱最前沿同步开展基础学术研究和产业应用合作,同时坚持不懈的推动以中文为基础的知识图谱开源开放工作。
陈华钧
浙江大学计算机科学与技术学院教授、博导。CCF专业会员、CCF杰出演讲者。主要研究方向为知识图谱与自然语言处理、大数据与知识工程、智能生物医药技术。浙江大学阿里巴巴知识引擎联合实验室负责人、浙江省大数据智能计算重点实验室副主任、国际大数据期刊Elsevier Big Data Research主编、中文开放知识图谱OpenKG牵头发起人、全国知识图谱大会CCKS2020大会主席、阿里巴巴藏经阁知识引擎研究计划咨询委员会专家。
CCF汇聚计算机领域优秀的人才,
在CCF,你将邂逅无限的机会和可能!
和68000+CCF会员共同追求卓越!
联系我们:membership@ccf.org.cn
扫码加入CCF