针对美国对中国的一系列科技遏制手段,自主可控、安全可靠的重要性进一步提升,国产数据库等正在进口替代和有望进口替代的领域将面临更大的市场空间和更好的市场格局,中国已有金仓、达梦、通用、神通、瀚高等国产数据库,然而市场一直尚未打开。遵照YOCSEF承担社会责任的宗旨,2019年10月11日下午, CCF YOCSEF济南在山东大学中心校区举IT观点论坛——“安全可靠自主可控的浪潮下,国内数据库系统如何实现突破性发展?”,邀请国内外数据库专家探讨中国应该怎样发展自主可控数据库系统,针对数据库系统自主可控的发展现状、技术瓶颈、研究趋势、机遇与挑战等若干话题展开思辨与讨论,希望为数据库系统自主可控的未来发展提供新的启发。
CCF YOCSEF济南委员及来自省内外多个高校和企业的五十多技术人员参加此次活动,其中东北大学计算机学院教授博士生导师于戈、瀚高软件首席科学家郑晓军、Apache HAWQ数据库顶级项目创始人及偶数科技创始人常雷、天津南大通用数据技术股份有限公司高级副总裁赵伟、阿里巴巴数据库产品负责人叶正盛(花名斗佛)、开源软件联盟中国PG分会副秘书长魏波、北京海量数据技术股份有限公司副总韩涵参与活动,多个分论坛也参与了此次活动,本次观点论坛活动由论坛执行主席史玉良、孔兰菊主持。
CCF YOCSEF(济南)本届主席孔兰菊首先致欢迎词,对CCF YOCSEF论坛及规则进行介绍,对本次观点论坛进行了介绍,东北大学的于戈教授、瀚高软件首席科学家郑晓军以及偶数科技的常雷博士应邀参加本次活动并作为专家进行了引导发言。
部分参会嘉宾合影
在引导发言阶段,来自瀚高软件的首席科学家郑晓军做了题目为“国产数据库发展历程、挑战与方向”的发言,给出了国外主流数据库产品在中国市场的发展现状;分析了国产数据库发展的必要性、有效途径以及所面临的市场挑战。并结合当今市场环境下数据库技术的发展热点——非易失内存、高速通信、分布式扩展架构、人工智能、区块链等新一代信息技术,分析了如何继续实现数据库的自主创新。
瀚高软件的首席科学家郑晓军引导发言
偶数科技创始人常雷博士从云计算与传统数据库结合的角度,分析了云技术在数据库应用时面临的资源管理、弹性计算等问题,给出了云数据库所面临的挑战。常雷博士结合自己的Apache顶级开源数据库研发工作,给出业界的解决方法和未来的研究方向,同时就云数据库是不是中国实现业界领先的一个突破口进行了分析。
偶数科技创始人常雷博士引导发言
东北大学的于戈教授以传统数据库管理技术与人工智能相结合为出发点,探讨了国产数据库发展的新机遇--AI赋能的数据管理新技术。在发言中,于教授分析数据管理中AI任务与关键科学问题、数据管理与人工智能的深度融合方法;提出需要重点研发的关键技术,包括:智能数据存储与访问、智能查询处理与优化、智能系统调优和组装等,探讨开发新一代的国产数据库管理系统的可行性。
东北大学的于戈教授引导发言
引导发言结束后,嘉宾围绕“数据库需要自主可控吗,局部可控还是关键模块可控?”、“新一代信息技术的需求的契机下,如何继续实现数据库的自主创新?”“数据库的创业公司如雨后春笋,能否带来数据库新的契机?”进行了长达三个小时的深入讨论。
嘉宾赵伟发言
与会人员热烈讨论
对于“数据库需要自主可控吗,局部可控还是关键模块可控?”的议题,南大通用副总裁赵伟认为oracle的成功在于成千上万的应用,能够不停的试错,informix在某个商业应用中运行了十几年,一次错误也没有。是因为有大量全球的商业应用场景,有大量客户在帮他试错,是磨出来的架构。想要打造国产数据库要耐得住寂寞,坚持一步一步地发展下去,坚持客户的积累。执行主席史玉良认为要和真正的用户去学习,最终变成一个真正的用户,才能做出好的系统。
晓军则认为所谓自主可控实际上是站在国家和政府的角度,单纯这样的命题具有浓厚的单一国有体制和计划经济的痕迹,忽略了当今市场复杂的经济成分。所以自主可控应该是对基础软件供应商的界定:需要这些供应商具有国家和政府可以掌控的程度,至于企业对自身所提供的产品和技术的自主与可控是必须的。
是开发能力可控还是代码可控?于戈认为可控要分不同的层次:从用户角度安全按自主可控,厂商自主发展;政府审查可控,例如基于区块链对于政府则不可控。赵伟则认为国家希望能够做到自主可控,这样安全性会更高,但是忌讳开源,因为开源意味着所有的开发人员都可以研究代码,有些不法分子可能会利用代码中存在的漏洞进行攻击,造成安全问题。晓军、开源pg分会魏波、成都AC 赵旭剑则提出反对意见,认为软件是否开源其本身与是否安全并没有直接的关系,数据库核心功能在于管理数据,安全不应该数据库单独承担。数据库只是操作系统中运行的一个软件,系统要做好防护措施。
与会人员认为,数据库是一种重要的基础软件,中国发展数据库是后来者,市场已经开始成型。作为后来者想要自主可控,必须有战略思维、把握创新。中国发展数据库等基础软件错过了开源软件所能带来的机会。今天我们看到除了国外垄断的商业软件产品,唯一能够获得成功的是当年的开源软件,如Linux与 MySQL。这两个软件都来自北欧,某种原因是因为那时候北欧的技术、经济发达,造就出一群愿意分享的软件开发群体。同时这些国家知识产权严格保护,Oracle等商业数据库软件并没有免费泛滥,开源的软件确实存在市场的需要,在代码公开的基础上,以支持、服务生存并得到发展。
当前国内数据库发展有几种形式:基于开源软件构建,例如瀚高、北京海量数据公司,基于Postgres,通过优化可以比肩商业数据库;基于国外商业数据库进行构建,例如南大通用采购自IBM informix;根据自己的情况进行开发,如阿里数据库专家叶正盛介绍阿里的Oceanbase每一行代码都是自己写的,偶数自主研发新一代云数据库,达梦与人大金仓等也是完全自主研发。这些是不是属于自主可控?与会人员认为数据库自主可控可以从多个层面判断:1.具备对代码的完全可控能力2.具备对系统的优化升级能力3.市场占用率10-20%;4. 数据库量级达到10万级;5.放在国家层面,不被国外卡脖子就是自主可控与安全可控。
对于“新一代信息技术的需求的契机下,如何继续实现数据库的自主创新?”议题,常雷认为DB2、 SQLServer已经满足了传统市场需求,没有必要再创造一个轮子。大家认为只有发现新的需求,才能激发创新,新的需求才是创业公司的机会,因为存在一个本质的规律:巨头不会早期投入大量的精力做创新;其次如何抓住新的技术的爆发点,是国产数据库的突破之路,因为大型商业数据库发展总是慢一点,如oracle要考虑大量的向下兼容,修改非常难。我们可以采用快鱼吃慢鱼的步骤,在大海里干不过对方,但是在江南水乡里是我们的优势。
对于如何实现创新,最重要的是要有驱动力。第一点是肯定是要响应市场的需要,在市场环境有一个新的业务场景,或者是业务需求,比如互联网加数据库模式,这本身也是一种创新,这是也就符合了当今这种互联网形式;第二点也是很重要的一个点,就是资本支撑,或者资本驱动。资本主要来自两方面,一个国家项目支持,另一个就是大公司经费支持;第三点技术支撑,技术支撑第一是需要人才,第二点找到技术的落脚点。与会人员认为高校与企业要做好结合,互补长短。高校有较强的研究能力,商业化运行能力弱,企业很难让研发部存粹研究,而大学有了雏形,企业更喜欢合作包装,推出产品。YOCSEF广州副主席王昌栋认为教育界培养学生的过程中,需要重视以国产软件为基础制定培养方案,同时国产软件也需要以一种“农村包围城市”方式占领市场。
针对兰菊抛出OceanBase和Oracle九年前的数据对比是否胜之不武的问题,大家认为这是个极限挑战的事,对于金融和电信行业来说,通过TPC-C的测试意味着资格证,没有这张资格证,OceanBase是没法进入这些行业的,至于极限性能,分布式的OceanBase和目前最新版本的Oracle应该是有差距的,只是目前市场需求会通过很多其他方式解决,不一定要用到极限性能。同时我们国产数据库必须寻找突破口,必须想办法突破Oracle等强者愈强的马太效应,支持OceanBase这次TPC的打榜做法。
对于第三个议题“数据库的创业公司如雨后春笋,能否带来数据库新的契机?”,常雷认为一定会,因为现在的巨头早期都是起源于创业,创业环境变得越来越好,满足个性化需求是一个契机。大家认为数据库应该能够定制化,满足各个行业需求的数据库,要有特定的技术,应对特定的市场。赵伟认为中国金融行业做自主可控一定要从分布式开始,新的创业公司一定要打分布式,数据库创业一定要和阿里中台避开,同时一定要走高端路线,低端必死。晓军对自主开源数据库推广并不乐观,现在以企业为主的开源不同于20年前linux,mysql类共产主义的开发环境,认为如果当年oceanbase如果每个小版本都开源,可能有替代MySQL的机会,现在很难。魏波则认为数据库库创业公司的技术落脚点基于现有开源领域是明智之举,共建、共享、共荣。
北京海量数据技术股份有限公司韩涵认为对于数据库来讲,它更多的是一个工程化问题,不能单纯将其看成学术研究,技术难点主要在于软件工程问题,需要更多时间去积累,在解决客户出现的各种各样问题的过程中打磨产品。中小数据库企业要发展要先要有客户,从小产品开始解决客户困难,不断在过程中积累经验并逐步完善自己的产品。可以先从做外围产品开始,从做工具软件开始,逐步做到数据库的核心。晓军认为国产数据库突破最重要的是扩展生态,给大家一个非常舒服代价非常低的上船机会。
Yocsef天津主席王鑫认为中国的创业公司着眼世界,要有大局观,常雷则认为如果能够占领大部分市场,就可以形成标准,肯定是好事,归根结底是市场占有率问题。晓军认为我们强大后,我们有10亿人的市场,我们就是标准。韩涵认为目前数据已经改成推荐行标准,行业必须需要标准的前提是互通与质量,如通信行业,其他行业淡化标准。
经过三个小时的讨论,论坛观点汇总如下:
1.自主可控要从不同的层面去把握:从国家的层面它要求数据库的整个供应链上的厂商都是能够掌控的,不被国外卡脖子,安全可控,生态可控;从企业的角度就是代码可控,具备数据运行优化的能力,市场占用率10-20%,企业根据市场需求、发展阶段决定可控的等级(原创或者基于开源优化、本土化),可控路径包括提升质量和功能。
2.数据库如何创新与突破:国产数据突破是一个工程化问题,覆盖大量的客户,解决各类问题,扩展生态,做好外围产品,再做核心产品。创业公司要选具有局部竞争优势的进行,在工具服务类进行,采用快鱼吃慢鱼的方式。
3.创业公司的机会:数据库应该能够定制化,走高端路线,满足行业需求,避免替代思维。推动数据库发展的两个主要因素一个是客户的需求,一个是硬件的发展,在新需求、新技术方面抢先登陆,实现创业目标。
本次活动思辨环节持续3个多小时,大家一致认为此次话题的讨论有现实意义和参考价值。同时,线上同步观点直播,许多未参会的委员也积极参与活动。CCF YOCSEF济南将继往开来、勇往直前,为国家经济发展和社会进步发挥应有的作用。