CCF YOCSEF武汉成功举办“知识图谱是数据的智慧还是算法的
智慧”专题论坛
中国计算机学会青年计算机科技论坛
CCF Young Computer Scientists & Engineers Forum
CCF YOCSEF武汉
YOCSEF 武汉专题论坛:知识图谱是数据的智慧还是算法的智慧
2017年12月25日下午,由CCF YOCSEF武汉分会主办,武汉大学信息资源研究中心和武汉大学人机交互协同创新团队联合承办的“知识图谱是数据的智慧还是算法的智慧” 专题论坛在武汉大学信息管学院隆重举行并取得圆满成功。此次论坛由YOCSEF武汉分论坛前主席顾进广教授和YOCSEF武汉分论坛委员洪亮副教授担任执行主席,并邀请了武汉大学计算机学院何德彪教授和湖南大学信息科学与工程学院彭鹏助理教授做主题报告,介绍了区块链防伪技术、知识图谱构建、分布式RDF知识图谱数据管理的发展前沿与进展。另外,此次论坛还邀请了YOCSEF武汉分论坛主席肖春霞教授,武汉大学信息管理学院吴丹教授、王晓光教授、邓胜利教授,李旭晖副教授、赵一鸣副教授,华中科技大学袁平鹏教授、李剑军副教授,武汉科技大学计算机科学与技术学院刘茂福教授等学者,同时有近50名来自武汉各大高校的本科生和研究生参会。本次论坛围绕“知识图谱是数据的智慧还是算法的智慧”这一问题,展开了深入的探讨与辩论。
本次论坛的主题是知识图谱是数据的智慧还是算法的智慧。近几年来,随着大数据+人工智能技术的快速发展,催生了一大批大数据驱动的智能应用,如比特币期货、聊天机器人、高考机器人等。知识图谱和区块链是这些智能应用背后的技术。知识图谱是人工智能应用的“石油”。知识图谱、自然语言处理、机器学习深度结合将推动人工智能迈上理解与智慧之路。机器可理解的数据是形成智慧的重要基础。然而,近期的Alpha Zero的成功表明,独立于大数据的算法也可以形成智慧。在此背景下,本次研讨会邀请了已取得优秀成果、站在科研第一线并有较大学术潜力的青年学者对领域内前沿问题进行互动。从数据和算法两个方面介绍了大数据智能环境下知识图谱和区块链技术的主要挑战、开放问题和典型应用。并邀请了相关领域的专家学者从各自的研究与工作角度,探讨“知识图谱是数据的智慧还是算法的智慧”,进行观点的交锋,得到思想碰撞的火花,为从事相关方向的研究者提供了强有力的参考。
(图1 论坛现场)
本次论坛分为两个议程:一是专题报告,分别由何德彪、洪亮和彭鹏三位老师就区块链和知识图谱进行专题报告,;二是专题论坛,邀请与会嘉宾就知识图谱是数据的智慧还是算法的智慧展开讨论发言。
在专题报告的环节中,何德彪老师首先进行了题为“基于区块链技术的防伪系统”的报告,主要介绍了区块链的定义、特点、工作流程及应用,对公链与私链进行了对比,并介绍了基于二维码的宝石防伪系统案例,畅谈了未来隐私保护、联盟链等发展方向,对了解区块链及其应用具有重要意义。紧接着由洪亮老师进行了题为“中文诗歌知识图谱的构建与服务”专题报告,结合他的科研团队的项目成果,介绍了如何从零开始构建大规模诗歌知识图谱,从概念模型、信息抽取和知识融合来讲解中文诗歌知识图谱的构建流程,并介绍了中文诗歌知识图谱可以实现知识查询、智能问答和可视化分析等智能服务,引起了与会嘉宾的热烈反响和讨论。在场的王晓光教授在报告后问道知识图谱如何表达诗词的意境、情感等关联,洪亮老师就这一问题回答,技术会丢失一部分情感、意境等深层次语义信息,他们正在寻求相关领域专家对情感及意境进行建模,揭示此间的语义关联。最后由来自湖南大学信息科学与工程学院的彭鹏助理教授发表了题为“分布式RDF知识图谱数据管理”的主题报告。他分别就知识图谱、分布式RDF数据库系统、分布式RDF知识图谱数据管理系统gStoreD几个方面进行介绍,着重讲了的主要技术手段及对gStore的改进研究。
(图2 何德彪教授做现场报告)
(图3 洪亮副教授做现场报告)
(图4 彭鹏助理教授做现场报告)
专题报告结束后由CCF YOCSEF武汉分论坛主席肖春霞教授向在座的师生介绍了CCF YOCSEF论坛组织与文化。之后,在本次论坛的专题讨论环节,与会专家就“知识图谱是数据的智慧还是算法的智慧”这一主题展开了激烈的讨论,每个嘉宾都分别阐述了自己的观点。
顾进广老师首先引导发言,他认为知识图谱的关键在于数据的智慧,数据数量质量在做支撑。随着数据的不断发展,目前深度学习正从理论探索逐渐走向应用。洪亮老师在引导发言中讲道知识图谱是算法的智慧,如区块链等复杂算法,可以产生一些数据。Alpha Zero算法本身可以模拟人类直接产生数据和智慧,通过强化学习产生的智慧都是独立于大数据而完成的。
在两位老师进行引导发言之后,参会嘉宾进行了自由发言。何德彪认为数据是基础,算法出现后占上风,所以他认为知识图谱是算法的智慧。袁平鹏则形象地将数据比作食材,算法就是制作过程,知识图谱是算法的智慧。此外,李剑军、肖春霞等也认为知识图谱是算法的智慧。肖春霞说:“数据是死的,它需要算法驱动”。机器、人工智能的进步并非机器本身的进步,而是人类智慧的进步,是算法的进步。具备了数据,关键在于如何处理,如何挖掘,因此关键在于算法。
同时,武汉大学信息管理学院邓胜利教授认为,知识图谱是数据智慧,智慧应是稳定的,算法是不断变化的,他认为数据知识化更加合适。王晓光教授则认为知识图谱是智慧数据,数据表示方式的进化使数据带有越来强的智慧属性。知识图谱有很多知识仍未能表示,很多问题仍未解决,因此他认为是知识图谱数据的智慧。
(图6 顾进广教授发言)
(图8 吴丹教授与邓胜利教授发言)
(图9 洪亮副教授发言)
针对这一观点,洪亮讲到,数据可分为客观事实和人类行为产生的数据。当算法发展到能对人类社会复杂度进行模拟的程度时,算法即可产生出数据,因此现在仍需要数据。吴丹教授则认为算法只有规则而无数据,复杂度低,大量数据可以生成具有更高智慧度的算法。武汉科技大学的刘茂福教授说,相同算法经过迁移学习能否解决不同领域的问题是关键,目前很多问题的解决并非容易。对此,洪亮则认为是有希望的,很多问题已经解决,已解决的问题不需再解决,机器进化快于人类社会进化。顾进广也总结道,数据表示越来越简化,若在数据表示模型上有所提升,则表示能力会有所突破,很多无法解决的问题也能慢慢解决。
整个论坛在轻松、活跃,而又充满思想碰撞和大脑风暴的积极气氛下展开,经过激烈的辩论,使得在场的专家和同学对知识图谱到底是算法的智慧还是数据的智慧这一命题有了更为深刻的认识,对目前的研究现状与将来的科研规划也产生了更为深远的指导意义。
(图10 与会嘉宾与YOCSEF旗帜合影)