转载

巨杉CTO王涛谈SequoiaDB开源前后的发展历程

巨杉CTO王涛谈SequoiaDB开源前后的发展历程

王涛,IBM 北美数据库实验室DB2数据库引擎研发团队前成员,SequoiaDB 数据库联合创始人兼CTO,2014年“全球商业最具创意人物100”——MCP100(Most Creative People in Business 100)获得者之一。这次我们有幸采访到了王涛,请他来讲讲自己的创业故事和 SequoiaDB 开源路上的风风雨雨。

CODE:首先,请您自我介绍一下吧!顺便讲一下您之前在 IBM 主要是负责哪些方面的? 

大家好,我叫王涛,现在是 SequoiaDB 的创始人兼 CTO。

创业 SequoiaDB 之前我曾在 IBM DB2 团队工作了多年。DB2 是一款非常老牌的数据库,从上世纪80年代初就已经存在了,DB2一开始是在大型主机上运行的数据库产品。在当初 IBM 主机风靡世界的年代,DB2基本被全球500强所有用户使用。直到上世纪80年代末,DB2 第一次被移植到微型计算机 OS2 上,这也是其后针对 Linux、Unix 和 Windows 版本的雏形。

作为 IBM DB2 全球最高技术专家小组的成员,我参与了 IBM 下一代大数据平台的架构规划,同时,因为精通数据库内核及体系结构,我也负责 DB2 核心引擎的研发。我在 DB2 团队的那几年,可以说恰逢 DB2 在开放平台市场上的巅峰时期。Oracle 在 OLTP 在线交易市场上一马当先,而 DB2 则在数据仓库和分析领域占据绝对的优势。

CODE: 您在回国从事数据库创业之初,遇到过哪些困难?又是怎么解决的? 

创业是很辛苦的,用现在网络上比较贴切的话来说,累得就像狗一样。有过亲身经历后,你会发现,虽然苦点累点,但是创业过程中的未知数和不定期的意外收获,以及内心感受到的成就感是远超于疲惫的,当然,这其中的艰辛过程要比嘴上说说复杂的多。

可能大部分初创企业刚开始都是和困难同行的,回想我们最初遇到的困难,主要包括产品选型和团队组建:

A. 对创业产品的选型 :在 IBM 的那几年,随着时间的推移和信息的爆炸式增长,NoSQL 数据库、大数据、Hadoop、云计算、SOA,这些新鲜的名词不断冲击着人们的视野,因为熟知关系型数据库的“底细”,我也看到了它未来发展的局限性,我认为在互联网经济大力发展的今天,不论是传统行业还是互联网行业都面临海量数据存储和处理的问题,我开始思考:数据管理的出路在哪里?找到一个合理的解决方案,这也是促使我创业的一个动机。

摸索、思考、论证,推翻,再重新思考,也许你会认为这过程蛮好玩,思考者都玩酷嘛,但说实话,我觉得有点儿“煎熬”,这是一个比较困难的阶段。经过这个阶段的研究和探讨,我认为新一代分布式数据库代表着未来数据库领域的发展方向。于是,开发一款自研的新型分布式数据库产品,成了我们创业的产品方向。

B. 创始团队的组建 :人才是企业发展的基石,对于创始团队来说,每个人才都是百分比的分母,他/她决定了我们产品和企业的未来。因为数据库是基础型的软件,做这类产品研发的资深工程师在全世界范围内都属于紧缺人才。如果你看过《最紧缺的十大人才》等分析报告,就会看到数据库开发人才紧缺是名列榜单的。更何况,是在长期被国外数据库统治的国内数据库行业寻找人才,不练就淘金的本领是很难找到合适的人才的。

凭借着我们对产品的设想,要做一款“自主研发的 NoSQL 数据库”的决心,通过各种渠道招聘、推荐、自荐,我们还真的吸引了一帮志同道合的人,就是我们现在的这帮人,内核引擎未采用任何开源代码,一行行的写代码,成功开发出了现在的 SequoiaDB 巨杉数据库。

CODE: SequoiaDB数据库目前和北美那些估值超过几十亿美元的新型数据库之间有哪些差异?

根据2015年2月份最新公布的 DB-Engines 排名,与 SequoiaDB 巨杉数据库同类型的 NoSQL 数据库 MongoDB 已跃居第四名,它的估值高达16亿美金市值,这也正说明了 NoSQL 数据的应用正成为一种新趋势,应用于越来越多的大数据市场和领域。

SequoiaDB 与 MongoDB 相比,功能类似,但 SequoiaDB 额外支持事务处理机制以及 SQL 功能。去年,国外第三方测评机构 Benchmark 公布了一个测评报告,在这份报告里,它分析了对三款NoSQL 数据库产品进行性能测试的结果,表明 SequoiaDB 数据库在数据插入场景中表现最为突出,甚至超过本身以插入性能而著称的 Cassandra,混合读写场景下性能也可圈可点。

HBase 与 Cassandra 虽然在写入性能上远高于 MongoDB,但是和 SequoiaDB 相比仍然逊色一筹。以下是测评报告的链接,可以 参考这里 。

CODE: SequoiaDB 数据库是否基于其他开源数据库或项目修改?有哪些呢? 

SequoiaDB 的内核引擎是自主研发,并没有基于其他开源数据库项目。这其中一个原因是大部分的开源基础项目,特别是开源数据库项目,都是有原厂,比如 MySQL 的原厂是 Oracle,Cassandra 的原厂是 DataStax,原厂虽然把他们的产品开源了,但是产品的技术方向还是由原厂来把控的。如果作为第三方基于原厂项目做修改,可能会产生不同的分支,而且分支越来越大 ,这也是为什么阿里现在有很多自研的项目。如果我们基于开源数据库来做修改,那我们永远只是其中的一个服务商,而不是原厂,那就缺乏核心竞争力。

2014年底,SequoiaDB 巨杉数据库已正式开源,代码托管在 CSDN CODE、GitHub、OSChina、GitCafe 等平台上面,欢迎大家可以去下载后进行技术交流。

CODE: 基于什么样的长远计划,才决定将 SequoiaDB 开源的呢?

SequoiaDB 团队由数据库开发专家组成,与一些大公司内部的开源项目不同,我们从一开始就基于高性能和广泛的应用场景进行设计和开发的,而不仅仅是为了解决某个公司内部的特定场景。所以,我认为开源是一种让产品充分适应市场,顺应需求而不断调整的最佳方式,我们希望通过开源的形式和市场密切的合作,提供专业的服务给中国的传统型企业和互联网企业。

CODE:SequoiaDB 巨杉数据库已开源,那么在开源之前这段时间里都做了哪些准备?是否存在一些问题?如何解决的?

准备工作的繁简主要是取决于开源者的目的,假如只是想尝试下,玩玩的性质,那可以不做任何事情,只是简单的把代码公布就行,前几天听说某个项目开源的形式是将源代码公布,社区却一直关闭,拒绝访问。而我认为如果是真正的想把开源做好,那宣布开源只是万里长征的第一步。

我个人认为,产品是社区建设的基石,只有产品的质量性能过硬,才能支持社区健康成长。而好的社区经营,可以推动产品发展,因为社区用户实际上就是推动产品成长的重要因素。他们发布的问题、分享的经验,对我们完善产品是非常重要的参考。

社区的经营理念是服务,不光是索取,这是一个平衡的关系。对于用户来说,他们需要有我们提供的技术支持,而对于厂商来说,我们希望用户提出改进意见,推动产品发展。

我们搭建了 SequoiaDB 的社区网站,有专门的 SequoiaDB 技术讨论群组,每天有不少的活跃用户提问和分享,我们尊重并重视每个开发者的问题和建议,定期将讨论话题汇总成专题,同时也让SequoiaDB 的开发者参与进来,一起进行技术交流和探讨,我们希望以踏实、务实、与用户实时互动的态度来经营社区,对待开源。

CODE: SequoiaDB  作为自主品牌的数据库已踏上开源之路,如何通过开源方式实现“互惠互利”的目标?

不可否认,开源在短期的确可以吸引不少关注度,比如提高产品的知名度,能够快速的积累用户。例如,IBM DB2 用了30年时间积累用户,而其他新的开源者像 MongoDB,用了才3-4年时间,就可以和这些数据库巨头比肩了,这一大程度是开源带来的功劳。

我想“吸引眼球”是开源的浅层次效应,在光芒褪去之后,回归到开源的本质:如何提升产品代码的质量、社区是否健康运营、用户是否活跃等。

对于我们,希望更多的人关注 SequoiaDB,使用它,给我们反馈建议就是最大的帮助,多多拍砖,我们也是极大欢迎的。而之于用户,我们要做的就是贡献,回馈给用户和关注者,吸取大家的建议,关注讨论,不断完善功能,提升质量,更好的服务用户。

CODE: 巨杉开源社区开展的怎么样,开展形式是什么样的,有什么好玩的事情?

目前我们的社区开展的不错,除了与国内几大有影响力的社区合作外,在他们平台开设 SequoiaDB专属版块外,我们也搭建了自己的社区、QQ技术讨论群、邮件列表等,全方位支持开发者和用户的交流。

好玩的事,就是我们在宣布开源一周后,发现有个爱好者写了篇 SequoiaDB 笔记,从源代码级别进行分析对比,这对我们来说是莫大的鼓励。这篇文章我们转给公司每个员工看,大家蛮兴奋的,看到外界对我们产品还是很关注,大家很受鼓舞。

另外,去年7月份,国外的一款 NoSQL 数据库 Aerospike 也宣布了开源,而我们是在12月中旬才宣布开源的,但是,从目前的代码 Fork 数量统计来看,我们一个月的 Fork 数量就超过他们总数量的一半。这也说明了咱们国内对开源的欢迎,关注度是非常高的。所以,我们 SequoiaDB 以后的发展计划就围绕两点,第一把产品做好,第二用心把巨杉开源社区经营好。

CODE: 涛哥最近实在是很忙,可否讲述一些愉快的内容,分享一下在百忙工作中获得的成就感? 

愉快的内容,我工作后放松的方式就是弹琴。不过,最近很近很少弹了,不少曲子都生了。今年是SequoiaDB 的崛起年,不管是产品的开发、市场推广,还是社区运营,这些都是我们的重点。繁忙的工作已成了生活的主题,都说创业不易,简直是比养个娃儿还累啊。但是看着公司团队茁壮成长,我们的产品功能增加,性能稳定,这就是最大的成就,所有的辛苦也都有了果实。而且我们拥抱开源,将自己的产品率先开源,也随时将产品的进步一起分享给社区,希望能带动国内的技术氛围,让更多的人去发现和创造新的技术。

以上观点纯属王涛个人看法。非常欢迎业内学者、专家等不吝交流。

转自: http://code.csdn.net/news/2823147

正文到此结束
Loading...