http://www.flyml.net
Cassandra具有常见NoSQL 分布式数据库 的优点, 但是值得一提的是:
http://www.flyml.net
任何一个厂家都会说自己的DB性能是XX的10x,甚至100x。但是实际使用上面,可能完全体现不出来~ 原因很多,比如厂家虚报成绩、特殊的测试场景。下面使我们的真实数据:
使用上完全满足了我们的需求。
PS: 笔者并没有对其他数据库做实际的性能测试,因此有可能采用其他的数据库表现会更好一些
一个好的产品,除了自己牛逼,还要搭建一整套生态环境,至少融入到一个大环境之中。我觉得Cassandra让我很开心的一点就是融入到了Spark 这个欣欣向荣的大生态之中。可以非常轻松的集成Spark来做统计分析,同时跟一个个人认为非常有潜力的Zeppelin轻松集成。
数据来源: http://stackoverflow.com/research/developer-survey-2016#technology-top-paying-tech 数据显示Cassandra也是很有钱景的一个工具
美国最值钱技术排行
上面说了不少Cassandra的好话,可能你要说我连听都没听过。。。
不过在国内,Cassandra用的公司确实很少,无论是从百度指数还是拉钩上面爬下来的数据显示,Cassandra的用户非常少,Hive 、 HBase 要多非常多。 可能这个跟实际的使用场景有关。
如果你需要一个分布式的实时数据库,同时又要求这个数据库方便的做数据分析(而不是另外创建数据仓库),我相信Cassandra绝对是一个值得考虑的选项!
下面分享一些真实的Cassandra相关的数据:
可以看到,MongoDB 独领风骚,关注度、使用人数都非常非常多。 但是接下来的第二名Cassandra基本上就完全压制了Hive / HBase。
只不过我们的业务场景,确实不太适合MongoDB,再加上不断有人在反馈当数据量非常大的时候,MongoDB开始莫名其妙的丢数据,也就敬而远之
整体情况跟GitHub 上面的数据完全一致。 只不过我们看到Hive最近上升的速度非常明显!值得关注~
http://www.flyml.net
其实在这里并不是忽悠大家一起去用Cassandra。 只是看到国内对Cassandra的使用太少,而自己觉得Cassandra 是一个很不错的数据库,并且Cassandra在国外的应用还是非常广, 我相信它值得大家花时间来了解了解, 甚至搭建一些测试环境来进行一些概念验证或者技术研究
我们的团队之所以最终选择了Cassandra,是综合考虑了数据库的各个方面的特性,并结合自己团队以及业务的特点来做得最终选择。并且性能并不是我们的最重要的因素。
http://www.flyml.net
如果您确实有兴趣来尝试Cassandra,可以看下一篇《Cassandra的安装、升级与集群维护》
敬请期待