“数据为王”的再思考与实践(内含独家福利!)| CNCC 技术论坛
本论坛将于CNCC第一天(10月22日16:00-18:00)在北京新世纪日航饭店3层云南厅会议室举行,邀请涂子沛、谢长生、李国良、孙凌翔、陈妍共五位专家与你探讨。
大数据时代催生出数字经济,各行各业都已经离不开数据,“数据为王”渐渐被人们所接受。数据对我们持续产生的影响是什么?数据技术有些什么新进展?本论坛将以“数据为王”给我们社会带来的深刻影响为背景,探讨多位重量级专家对于“数据为王”的再思考和实践,并展开富有建设性的对话。
独家福利!现场前90名和线上前10名提问的听众,每人免费赠送一本新书《数商》(涂子沛著,中信出版集团)(由于时间有限,每位讲者限提两个问题)。
讲者简介
数文明科技
涂子沛
报告一题目:数据智能和城市大脑的未来
报告摘要:2016年以来,城市大脑的概念在中国引爆,此后这个名词在搜索引擎上不断攀升。而这个单词,在100年前就在英文资料当中出现。在知网上,中文世界能追溯到的最早关于城市大脑的论述出现于2001年。在一篇介绍广东省南海市信息化建设经验的长文中,作者畅想了未来的“数字城市”,认为“一条条相互勾连的光纤是城市的神经,各种各样的信息是其中流淌的血液,一个超级CPU(中央处理器)是城市的大脑”。本次演讲回顾了城市大脑概念在中国的兴起和演变,现阶段建设的概况进行了说明,并对建设城市大脑的技术路径、步骤进行阐述。
报告人简介:涂子沛,数文明科技CEO,广州市第十五届人大代表,阿里巴巴集团前副总裁,同时担任人民网独立董事、伊斯佳科技股份董事等职务,受聘为浙江省特聘专家、广东省“数字政府”专委会委员、中山大学客座教授、中国人民大学客座研究员等,著有《大数据》、《数据之巅》、《数文明》、《数商》、《给孩子讲大数据》、《给孩子讲人工智能》等书,著作受到了中央政治局常委、全国政协主席汪洋,企业家柳传志,历史学家许倬云等政商学名人的高度评价,书中观点被中央及地方政府文件多次引用。
华中科技大学
谢长生
报告二题目:“万物皆数”的哲科思考
报告摘要:在认识自然的体系上,钱学森提出哲学、科学、技术、应用四个层次,而两千多年前我国的道家就提出“道、法、术、器”四个层面,两者是高度契合的。由于历史原因,我国长期在“术、器”层面高度发达,而在“道、法”层面十分缺乏,尤其缺乏科学思维。科学革命后,科学的引领和基础性作用日益凸显,单靠“术、器”思维已步履艰难,数字技术及其革命更是如此。我国表面上看起来也是数字技术(术)发展一日千里,数字应用(器)改变生活方式,但在哲学(道)和科学(法)层面的基础都是西方人打下的。不论是二进制、数理逻辑、图灵机、信息论等基础理论,还是半导体、集成电路的基础量子力学,互联网和云计算的宏观思想,甚至当今火热的深度学习算法及量子计算的提出,都全然没有中国人的贡献。下一步走向何方,我们真的需要在哲科层面作深入思考,不能只在西方人开辟的道路上做出了较大的“术、器”层面的进展就沾沾自喜,在西方人引领的学术道路上发表了比人家数量多的文章就自以为已经超越。只有看清历史,才能面向未来。本报告试图从哲科层面梳理“万物皆数”的历史脉络,并对其未来的发展进行探讨,希望抛砖引玉, 使更多的人来思考信息领域哲科层面的问题,期待我国年轻一代能在哲科层面作出引领未来的重要贡献。
报告人简介:谢长生,华中科技大学特聘教授,长期从事计算机系统结构及存储技术的教学与科研,是信息存储系统教育部重点实验室首任主任。主持了国家自然科学重点基金等多项国家级项目,在国内外会议及期刊上发表论文200余篇,拥有50多项专利,研究成果曾获得国际国内多项奖励。为学术界和工业界培养了大批高层次人才。
清华大学
李国良
报告三题目:AI原生数据库系统
报告摘要:大数据时代下,数据库系统主要面临着三个方面的挑战。首先,基于专家经验的传统优化技术(如代价估计,连接顺序选择,参数调优)已经不能满足异构数据、海量应用和大规模用户对性能的需求。我们可以设计基于学习的数据库优化技术,使数据库更智能。其次,AI时代很多数据库应用需要使用人工智能算法,如数据库中的图像搜索。我们可以将人工智能算法嵌入到数据库,利用数据库技术加速人工智能算法,并在数据库中提供基于人工智能的服务。再者,传统数据库侧重于使用通用硬件(如CPU),不能充分发挥新硬件(如ARM、AI芯片)的优势。
为了解决这些挑战,我们提出了原生支持人工智能(AI)的数据库系统。一方面,我们将各种人工智能技术集成到数据库中,以提供自监控、自诊断、自愈、自优化、自安全和自组装功能。另一方面,我们通过使用声明性语言让数据库提供人工智能功能,以降低人工智能使用门槛。我们定义了人工智能原生数据库的五个阶段,给出了设计人工智能原生数据库的挑战。最后还以数据库自动调优、基于深度强化学习的查询优化、基于机器学习的基数估计和自治索引/视图推荐为例,展示人工智能原生数据库的优势。
报告人简介:李国良,清华大学计算机系长聘教授,杰青。主要研究方向为数据库,大数据分析和挖掘,智能数据管理。在数据库、数据挖掘、信息检索领域的顶级会议和期刊上发表论文100余篇,他引8000余次,入选爱思唯尔2014-2020年中国高被引学者榜单。主持国家杰出青年基金、优秀青年基金、青年973、自然基金重点等项目。获得了VLDB 2017 Early Career Research Contributions Award(VLDB青年贡献奖,亚洲首位获奖者)、IEEE TCDE Early Career Award(IEEE 数据工程领域杰出新人奖)、青年长江学者、“万人计划”青年拔尖、计算机学会青年科学家奖等奖项。担任VLDB Journal、IEEE TKDE编委,SIGMOD21大会主席、VLDB21 演示主席。获得过KDD、ICDE、CIKM等顶级会议的最佳论文奖。获国家科技进步二等奖、江苏省科技进步一等奖。
华为
孙凌翔
报告四题目:从华为存储看数据
报告摘要:随着数据的指数级增长,数据存储逐渐成为IT产业中最重要的核心部分。从预研开始,华为存储经过十余年不断积累,逐渐发展成为目前在国际上首屈一指的存储品牌。本报告将回顾研发团队对多源异构数据存储逐渐加深的认识,介绍华为存储在存储产品上的设计思想和方法,并展望将来数据存储产品的发展趋势。
报告人简介:孙凌翔,华为存储与机器视觉技术开发部部长华为存储与机器视觉技术开发部部长。华为存储产品创始人之一,经历了华为存储从预研开始,第一代产品起步到现在业界竞争力第一的辉煌过程。担任过产品的开发,设计,交付和研发部长等岗位。17-20年期间去美国创建了波士顿研究所,研究IT产业的新技术和解决方案。现在承担存储和机器视觉技术研发工作,构筑产品未来的核心竞争力。
腾讯
陈妍
报告五题目:多源数据融合技术的应用研究和平台化思路
报告摘要:介绍腾讯用户研究团队在产品生命周期全流程研究时面对的多源数据类型和特点,以及在多源数据融合技术上的基础研究成果和多个具体业务应用案例,并探讨多源数据融合的平台化思路与对研究投入产出比的提升效益。
报告人简介:陈妍,腾讯用户研究与体验设计部总经理。主导设计过多款中国互联网成功产品及活动;并通过海量用户的产品研究项目(如微信等)以及中国互联网网民基础研究项目,积累多年研究经验,打造具有互联网特色的研究工具和平台,建立了“互联网银行用户体验实验室”、“互联网保险用户体验联合实验室”“社交广告品牌与用户体验研究实验室”以及“互联网公益”“数字广东产品规划设计部”等方向的团队,培养人才及积累面向C端,B端及G端的服务设计经验。
CCF推荐
【精品文章】
CCF颁奖典礼限量门票开售