2017级刘睿民同学就数据库产业发展趋势接受上海人民广播电台采访

发布时间 :2021年01月29日

在之前落幕的长三角科交会上,上海人民广播电台对PSL·巴黎九大高级工商管理博士2017级同学、柏睿数据董事长刘睿民进行了专题采访,刘睿民带领的团队曾经参与制定大数据世界标准,对大数据行业的发展有着最前沿的研究成果与最直接的商业实践。在此次访谈中,他与主持人共同探讨了数据库产业技术的发展趋势与中国数据库企业的成长和发展路径,以下为访谈实录:


访谈丨上海人民广播电台
整理丨柏睿数据市场部

 

 

主持人:大家好,这里是《访谈时刻》之科技之声特别栏目,我是来自上海人民广播电台长三角之声的旭东,今天在长三角科交会的现场带大家来探访最前沿的资讯,做客直播间的是柏睿数据董事长兼首席科学家刘睿民。刘总你好!

 

刘睿民:大家好!

 

主持人:首先请刘总介绍一下公司主要的产品或者核心的技术是什么?

 

刘睿民:柏睿数据最主要的产品是全内存分布式数据库和全内存流数据库。

 

主持人:光听名字平常人就处在一种中文都听得明白但组合在一块不知道什么意思(笑),但是我能提取到一个老百姓比较有概念的词——数据库,我们普通人手机里边可能也会接一个数据库。

 

刘睿民:对,任何只要处理数据的设备都要用到数据库,它是我们信息化建设最基本的必需品。

 

主持人:大部分人对数据库的概念有限,咱们的数据库是什么样的存在?是硬件吗?

 

刘睿民:一般人认为,做数据处理或是大数据主要取决于硬件,其实这种说法是不全面的。数据库是一种软件,确切来说,与操作系统同为基础软件,看不见摸不着。本次科交会柏睿数据带来的数据管存算一体机是把我们的核心软件与先进硬件相结合的产品,虽然价格相当于十几台高端车,但其中真正体现价值的并不是机器,不是硬件的部分,而是我们的基础软件。

 

主持人:我们的基础软件都解决了什么样的问题呢?

 

刘睿民:进入大数据时代后,数字经济的崛起导致了庞大数据的产生。在2014年公司创立之初我的判断是有10万倍的增量,但实际情况远超预估。我们拿智能机和之前用的诺基亚这种功能手机做一个类比,现在我们的手机产生的数据量可以达到之前的100万倍,所以要处理原来100万倍的数据量,还要保证同样的速率的话,技术要经过巨大的变革。我们的全内存分布式数据库就是用来解决这个问题的。我们研发的是实时分析型的数据库,运用我们的技术产品,能够在毫秒、秒级的时间维度上把数据进行实时的数据分析。假设你可能要在几百张表或上千亿条数据中找到其中的相关信息,我们的产品可以帮助你在极短的时间内找到,可以说这是完全具有质变和颠覆性的技术。

 

主持人:因为我平时的工作也会和一些科研人员沟通,也会聊到“跑数据”,通常会花很长的时间。而我们是可以做到对海量数据在非常短的时间内以人几乎感知不到的速度跑出结果。而且有时我们去参观一些高新企业,会有一些数字化的展板或者大屏,上面会实时的显示全球的用户数量、用户的画像等等数据,我们的数据库也可以帮助他们做到数据的实时更新。那我们怎么理解数据库的技术实现?

 

 

刘睿民:其实数据库全称是数据库管理系统,是一个标准化的软件系统,是基础软件之一,它并不因为数据的类型而改变。

 

比如在钢铁行业,我们可以说我们拥有一个钢铁数据库,但实际上是把钢铁行业的相关数据存在了数据库里边,所以叫钢铁数据库。但数据库软件本身是一个标准件。美国甲骨文Oracle横行世界40年,一旦研发出来是不会做定制化的。他的接口,输入输出全部都是标准化的技术实现。我们也是按照国际通行的标准来研发数据库,这也是为什么我在15年提出流数据库的国际标准之后,也是把我们的中国技术标准推动成为国际标准之后,也是按照这个路线去走的。

 

主持人:也就是说我们的数据库作为一个系统可以接入任何一个有需求的企业。

 

刘睿民:对,也就是说你买了cpu等硬件,还要跑操作系统,比如win10或者是Linux,一般服务器都是Linux。再来如果有跑数据的需求,就要有数据库,就需要甲骨文或者我们柏睿数据。

 

主持人:您可不可以给我们举一些好的合作案例,现在都流行使用前使用后的对比。没有用咱们的数据库之前,企业可能遇到的情况,和用了我们的数据库之后,又能取得怎样的效能呢?

 

刘睿民:举两个例子吧。在我国扶贫攻坚的过程中,民政局管理着我们所有的扶贫数据。在传统的扶贫工作中,用以往的数据库跑数据要几个小时才能出结果。我们经过的内存化改造以及多次调优以后,所用的时间从十几秒,变成10秒,最后大概只要6到7秒钟就能出结果,帮助我们的扶贫干部在短时间内就可以非常精准的找到某一户状况如何,如家庭情况,有没有伤残或者失去生活能力等等类似这样的信息,对精准扶贫带来了很大的便利。

 

另外,我们最近在5G通信方面下了很大的功夫。大量的传感器、摄像头已经积累了大量的数据,在回传的过程中,虽然5G通信技术已经实现了,但传统数据库消化不了这么多的数据,导致数据的传输包括数据的解析方面都出来了严重的延迟,我们的流数据库就解决了这方面的问题,大量的数据进来以后我们通过高并发的在全内存流数据库,在落到磁盘之前就获得了处理。

 

主持人:您刚才也提到我们的技术在国内来看是非常领先的,对标的对象都是国际上的领跑了很多年的科技巨头。如果说把我们的产品放到国际上进行比较,我们的核心竞争优势在哪里?

 

刘睿民:第一点,我们在流数据库技术的研究开始的是比较早的,当时我在15年提出流数据库国际标准的时候,当时的甲骨文他们都很惊诧,他们觉得之前我们在数据库方面完全原创的成果比较少。我们做出来流数据库的国际标准的时候,已经有比较成熟的产品了,然后很多硅谷的开源的公司跟进我们的国际标准,照着我们的国际标准开始往前推进。因为早开始这么几年,我们一直保持着性能优势,这是我们在流数据库方面的优势。再比如全内存分布式数据库,在专门做实时分析引擎的技术领域,在全球也就是有6家公司能够做我们这样的技术,比如老牌像甲骨文、微软、SAP。像SAP是做全内存数据库的鼻祖,大概比我们早五年做出这样的产品,但是我们比较自豪的是在性能方面我们已经超过这三家传统的科技巨头。同时还有一些硅谷新兴的公司,比如databricks,近年来他们的估值达到了100亿美金。我们的性能也超过他们大概40%-60%左右,从商用产品来说,一点也不比美国的同行落后。

 

主持人:太棒了,对于柏睿数据做出这样的成绩我们也是感到很自豪。因为作为数据库的使用方,不仅仅是企业,还有像是我们的一些政府部门,如果我们上升一些的话可能会涉及国家安全层面。一些特别核心敏感的数据、一些统计方面的数据放到外国的服务器当中,可能让人有那么一些不自在。

 

刘睿民:我们之前确实也存在这样的问题。比如我们的税务、工商、统计、发改、银行等大量的数据都是跑在不是我们中国人自己研发的数据库上面。说老实话,凡是软件包括硬件都是存在隐患的,一旦被不好的人利用会对国家来说会产生相当大的损失。我们一直以来都在支持国家在统计领域、工信领域、发改领域数据处理方面的推进。

 

主持人:那本次科交会带来的数据管存算一体机您刚刚说到是一个软硬一体的产品,您能描述一下他的外观有多大吗?

 

刘睿民:跟我们在数据中心看到的机柜是差不多大的。

 

主持人:虽然价值很高,但从个头上不算巨大。

 

刘睿民:因为这个其实只是一个处理单元,可以进行横向扩展,可以不断的往里加,类似于并联可以加好多,这也是我们提到的高并发技术。

 

主持人:您刚刚提到了单个的报价,我们可以算一算一整个系统的价格还是得掂量掂量的(笑)。我们继续来聊一聊整个产业的问题,你觉得数据库或者大数据领域在未来的趋势是怎么样?

 

刘睿民:聊到大数据的发展我每次都会回忆刚刚创业时的思考。首先我们解决的是数据存储的问题,数据产生了怎么办。这是前五年的问题,现在这个问题基本解决了,我们找到了一些廉价的设备把数据能够存起来。但我们不能把他们闲置起来,在这之后我们要解决数据处理分析的问题,能够进行查询分析。第三步,就是数据的实时查询,分析查询的结果必须是实时的,能够做到所见即所得,才能更有效率的运用数据的价值。

 

主持人:可以看出我们正处在第三个的阶段。稍稍延展一下,替用户问一些问题。我们的企业可能已经建立了自己的数据库,但可能只处于存或者查的阶段,那我们迈向第三个阶段的过程,这个转化是说只要用到我们的产品就可以,还是说要对整个系统进行更换?

 

刘睿民:基本使用以后就能从批量查阶段升级到实时查的阶段。并且在使用了我们的技术产品后,能够做到智能分析。

 

主持人:我们有这么多具有竞争力的技术,有考虑过走出国门吗?

 

刘睿民:其实我们一直在进行全球化的布局,并且积极参与国际上的竞争,包括人才的引进、产品的研发,我们都是站在全球化的角度上进行考量的。我们也可以看到除了我们,刚刚提到的几家企业都是欧美,除了SAP是德国,其他的都在美国。

 

主持人:其实只是能和这些科技巨头并驾齐驱这一点就能让我们感觉非常自豪了,关键是我们的产品还非常的能打,甚至实现了在性能方面的超越,相信柏睿数据能够继续保持这样的前进势头。今天再次感谢柏睿数据的刘总做客我们的《访谈时刻》科技之声,感谢各位。

 

上一篇: 龚槚钦、孙志勇、缪汉东三位同学受邀为PSL·巴黎九大EMBA项目做研究分享 下一篇: 喜讯|2012级Jack Woo 通过(PSL)巴黎文理研究大学PhD哲学博士论文答辩