图片来自 包图网
上方是外围的报告内容,先上论断:
在混合上班负载场景中,实时更新不会影响 RedisJSON 的搜查和读取性能,而 ElasticSearch 会遭到影响。
以下是详细的数据:
此外,RedisJSON 的读取、写入和负载搜查提前在更高的百分位数中远比 ElasticSearch 和 MongoDB 稳固。
当参与写入比率时,RedisJSON 还能处置越来越高的全体吞吐量,而当写入比率参与时,ElasticSearch 会降落它可以处置的全体吞吐量。
如前所述,reresearch 和 RedisJSON的开发十分强调性能。关于每一个版本,咱们都想确保开发者可以体验到稳固和产品。为此,咱们咱们给出了一些剖析工具、探测器来启动性能剖析。
并且,咱们每次发行新版本时时,也在不时的优化性能。特意是关于 reresearch 来说,2.2 版本在加载和查问性能上都比 2.0 快了 1.7倍,同时还改良了吞吐量和数据加载的提前。
接上去的两个图显示了运转纽约市出租车基准测试的运转结果。
从这些图表中可以看出,每一个 reresearch 的新版本都有一个实质性的性能改良。
为了评价搜查性能,咱们索引了 590 万篇维基百科摘要。而后咱们运转一个全文搜查查问面板,获取的结果如下图所示。
从上方的图可以看出,经过从 v2.0 迁徙到 v2.2,雷同的数据,在写、读、搜查(提前图)方面都有了大幅度的改良,从而提高了运转 Search 和JSON 的可成功吞吐量。
为了评价 RedisJSON 的性能,咱们选择将它与 MongoDB 和 ElasticSearch 启动比拟。
为了繁难对比,咱们会从文档存储、本地可用、云中可用、专业支持和提供可伸缩性、性能等方面启动全方位的对比。
咱们经常使用了完善的 YCSB 规范来启动测试对比,它能够基于经常出现的上班负载来评价不同的产品,测量提前、吞吐量曲线直到饱和。
除了 CRUD YCSB 操作之外,咱们还参与了一个两个字的搜查操作,专门协助开发人员、系统架构师和 DevOps从业者找到适宜他们用例的最佳搜查引擎。
此次测试,咱们经常使用了如下的一些软件环境:
此次是在 Amazon Web Services 实例上运转基准测试,这三种处置方案都是散布式数据库,并且最罕用于消费中的散布式形式。
这就是为什么一切产品都经常使用相反的通用 m5d.8xlarge VM 和本地 SSD,并且每个设置由四个 VM 组成:1 个客户端 + 3个数据库主机。
基准测试客户端和数据库主机都在处于最佳网络条件下的独自 m5d.8xlarge实例上运转,将实例严密地打包在一个可用区内,成功稳态剖析所需的低提前和稳固的网络性能。
测试是在三节点集群上口头的,部署细节如下:
除了这个关键的基准/性能剖析场景之外,咱们还在网络、内存、CPU 和 I/O 上运转基准基准测试,以了解底层网络和虚构机个性。
在整个基准测试集时期,网络性能坚持在带宽和 PPS 的测量限度以下,以发生稳固稳固的超低提前网络传输(每个数据包 p99 <100micros)。
接上去,咱们将从提供独自的操作性能“100% 写入”和“100% 读取”开局,并以一组混合上班负载完结以模拟理想上班中的运行程序场景。
如下图所示,该基准测试标明,RedisJSON* 的摄取速度比 ElasticSearch 快 8.8 倍,比 MongoDB 快 1.8倍,同时坚持每个操作的亚毫秒级提前。值得留意的是,99% 的 Redis 恳求在不到 1.5 毫秒的时期内成功。
此外,RedisJSON* 是咱们测试过的惟逐一种在每次写入时智能更新其索引的处置方案。这象征着任何后续的搜查查问都会找到更新的文档。
ElasticSearch 没有这种细粒度的容量;它将摄取的文档放在一个外部队列中,并且该队列由主机(不受客户端控制)每 N 个文档或每 M秒刷新一次性。他们称这种方法为近实时(NRT)。
Apache Lucene 库(它成功了 ElasticSearch 的全文配置)旨在极速搜查,但索引环节复杂且惨重。
如这些 WRITE 基准测试图表所示,因为这种“设计”限度,ElasticSearch 付出了渺小的代价。
联合提前和吞吐量改良,RedisJSON* 比 MongoDB 快 5.4 倍,比 ElasticSearch 快 200 倍以上,用于隔离写入。
与写相似,咱们可以观察到 Redis 在读取方面体现最佳,准许读取比 ElasticSearch 多 15.8 倍,比 MongoDB 多 2.8倍,同时在整个提前范畴内坚持亚毫秒级提前,如下表所示。
在联合提前和吞吐量改良时,RedisJSON* 比 MongoDB 快 12.7 倍,比 ElasticSearch 快 500倍以上,用于隔离读取。
实践运行程序上班负载简直总是读取、写入和搜查查问的混合。因此,在凑近饱和时了解由此发生的混合上班负载吞吐量曲线更为关键。
作为终点,咱们思索了 65% 搜查和 35% 读取的场景,这代表了一个经常出现的理想环球场景,在该场景中,咱们口头的搜查/查问比间接读取更多。
65% 搜查、35% 读取和 0% 更新的初始组合也造成 ElasticSearch 和 RedisJSON* 的吞吐量相等。
虽然如此,YCSB 上班负载准许您指定搜查/读取/更新之间的比率以满足您的需要。
“搜查性能”可以指不同类型的搜查,例如“婚配查问搜查”、“分面搜查”、“含糊搜查”等等。
咱们所做的最后向 YCSB 参与的搜查上班负载仅专一于“婚配查问搜查”,模拟分页的两词查问婚配,按数字字段排序。
“婚配查问搜查”是任何启用搜查配置的供应商启动搜查剖析的终点,因此,每个支持 YCSB的数据库/驱动程序都应该能够在其基准驱动程序上轻松启用此配置。
在每个测试变体中,咱们参与了 10% 的写入,以按相反的比例混合和缩小搜查和读取百分比。
这些测试变体的指标是了解每个产品如何处置数据的实时更新,咱们以为这是理想上的架构指标,即写入立刻提交到索引,读取一直是最新的。
正如您在图表中所看到的,在 RedisJSON* 上不时更新数据和参与写入比例不会影响读取或搜查性能并提高全体吞吐量。
对数据发生的更新越多,对 ElasticSearch 性能的影响就越大,最终造成读取和搜查速度变慢。
ElasticSearch 可成功的 ops/sec 从 0% 更新到 50% 的演化,咱们留意到它在 0% 更新基准上以 10k Ops/sec开局,并遭到重大影响,缩小了 5 倍的 ops/sec,在50% 更新率基准。
与咱们在上述单个操作基准中观察到的相似,MongoDB 搜查性能比 RedisJSON* 和 ElasticSearch 慢两个数量级,MongoDB的最大总吞吐量为 424 ops/sec,而 RedisJSON* 为 16K 最大 ops/sec。
最后,关于混合上班负载,RedisJSON* 支持的操作数/秒比 MongoDB 高 50.8 倍,比 ElasticSearch 高 7 倍。
假设咱们将剖析集中在混合上班负载时期的每种操作类型的提前上,与 MongoDB 相比,RedisJSON* 可将提前降落多达 91 倍,与ElasticSearch 相比,提前降落 23.7 倍。
与测量每个处置方案饱和之前发生的吞吐量曲线相似,在一切处置方案通用的可继续负载下启动完整的提前剖析也很关键。
这将使您能够了解关于一切已颁布操作在提后方面最稳固的处置方案是什么,以及哪种处置方案不易遭到运行程序逻辑引发的提前峰值的影响(例如,弹性查问缓存未命中)。
假设您想更深化地了解咱们为什么要这样做,Gil Tene 提供了提前测量留意事项的深化概述。
检查上一节的吞吐量图表,并关注 10% 更新基准以蕴含一切三个操作,咱们做了两种不同的可继续负载变动:
在上方的第一张图片中,展现了从 p0 到 p9999 的百分位数,很显著,在每次搜查时,MongoDB 的体现都远远优于 Elastic 和RedisJSON*。
此外,关注 ElasticSearch 与 RedisJSON*,很显著,ElasticSearch容易遭到较高提前的影响,这很或许是由渣滓搜集(GC)触发器或搜查查问缓存未命中惹起的。
RedisJSON* 的 p99 低于 2.61 毫秒,而 ElasticSearch p999 搜查到达 10.28 毫秒。
在上方的读取和更新图表中,咱们可以看到 RedisJSON* 在一切提前范畴内体现最佳,其次是 MongoDB 和 ElasticSearch。
RedisJSON* 是在一切剖析的提前百分位数上坚持亚毫秒级提前的惟一处置方案。
在 p99,RedisJSON* 的提前为 0.23 毫秒,其次是 MongoDB 的 5.01 毫秒和 ElasticSearch 的 10.49毫秒。
写入时,MongoDB 和 RedisJSON* 即使在 p99 时也能坚持亚毫秒级的提前。
另一方面,ElasticSearch 显示出高尾提前(>10 毫秒),这很或许与造成 ElasticSearch搜查峰值的要素(GC)相反。
仅关注 ElasticSearch 和 RedisJSON*,在坚持 6K ops/sec 的可继续负载的同时,咱们可以观察到 Elastic 和RedisJSON* 的读取和更新形式与以 250 ops/sec 启动的剖析坚持分歧。
RedisJSON* 是更稳固的处置方案,其 p99 读取时期为 3 毫秒,而 Elastic 的 p99 读取时期为 162 毫秒。
在更新时,RedisJSON* 保管了 3 毫秒的 p99,而 ElasticSearch 则保管了 167 毫秒的 p99。
专一于搜查操作,ElasticSearch 和 RedisJSON* 以个位数 p50 提前开局(p50 RedisJSON* 为 1.13 毫秒,而ElasticSearch 的 p50 为 2.79 毫秒)。
其中 ElasticSearch 付出了 GC 触发和查问缓存未命中的代价在较高的百分位数上,在 >= p90 百分位数上明晰可见。
RedisJSON* 将 p99 坚持在 33 毫秒以下,而 ElasticSearch 上的 p99 百分位数为 163 毫秒,高出 5 倍。
开局经常使用RedisJSON*,咱们可以创立一个收费的数据库在一切地域的 Redis 云,或许经常使用 RedisJSON docker 容器。
咱们曾经更新了 redisjson 的文档,以繁难开发者极速的开局经常使用查问和搜查配置。
此外,正如咱们在最近的客户机库申明中提到的,以下是几种盛行言语的客户机驱动程序,可以协助您极速入门。
作者:xiangzhihong8 编译
编辑:陶家龙
本网站的文章部分内容可能来源于网络和网友发布,仅供大家学习与参考,如有侵权,请联系站长进行删除处理,不代表本网站立场,转载联系作者并注明出处:https://clwxseo.com/wangluoyouhua/7662.html