本文主要是介绍全世界最快的内存数据库Dragonfly,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
一、全世界最快的内存数据库
Dragonfly是一种针对现代应用程序负荷需求而构建的内存数据库,完全兼容Redis和Memcached的 API,迁移时无需修改任何代码。相比于这些传统的内存数据库,Dragonfly提供了其25倍的吞吐量,高缓存命中率和低尾延迟,同时Dragonfly还能轻松进行垂直扩展。
二、基准测试
Dragonfly在c6gn.16xlarge上达到了每秒380万个查询(QPS),相比于Redis,吞吐量提高了25倍。
在Dragonfly的峰值吞吐量下,P99延迟如下:
所有基准测试均使用memtier_benchmark(见下文),根据服务器类型和实例类型调整线程数。memtier运行在独立的c6gn.16xlarge机器上。对于setex基准测试,我们使用了500的到期范围,以便其能够存活直到测试结束。
memtier_benchmark --ratio ... -t <threads> -c 30 -n 200000 --distinct-client-seed -d 256 \
--expiry-range=...
当以管道模式运行,并设置参数--pipeline=30时,Dragonfly可以实现10M qps的SET操作和 15M qps的GET操作。
Memcached / Dragonfly
在 AWS 的 c6gn.16xlarge 实例上比较了 memcached 和 Dragonfly。如下图所示,与 memcached 相比,Dragonfly 的吞吐量在读写两方面上都占据了优势,并且在延迟方面也还不错。对于写入工作,Dragonfly 的延迟更低,这是由于在 memcached 的写入路径上存在竞争(请参见此处)。
设定基准
获取基准测试
对于读取基准测试,Memcached 表现出了更低的延迟,但在吞吐量方面比不上Dragonfly。
内存效率
在接下来的测试中,我们使用 debug populate 5000000 key 1024 命令向 Dragonfly 和 Redis 分别写入了约 5GB 的数据。然后使用 memtier 发送更新流量并使用 "bgsave" 命令启动快照。下图清楚地展示了这两个服务器在内存效率方面的表现。
在空闲状态下,Dragonfly 比 Redis 节省约 30% 的内存。在快照阶段,Dragonfly 也没有显示出任何明显的内存增加。但同时,Redis 在峰值时的内存几乎达到了 Dragonfly 的 3 倍。Dragonfly 完成快照也很快,仅在启动后几秒钟内就完成了。
三、配置方法
Dragonfly 支持 Redis 的常见参数。例如,可以运行:dragonfly --requirepass=foo --bind localhost。
目前,Dragonfly 支持以下 Redis 特定参数:
-
port:Redis 连接端口,默认为 6379。
-
bind:使用本地主机名仅允许本地连接,使用公共 IP 地址允许外部连接到该 IP 地址。
-
requirepass:AUTH 认证密码,默认为空""。
-
maxmemory:限制数据库使用的最大内存(以字节为单位)。0 表示程序将自动确定其最大内存使用量。默认为 0。
-
dir:默认情况下,dragonfly docker 使用 /data 文件夹进行快照。CLI 使用的是 ""。可以使用 -v docker 选项将其映射到主机文件夹。
-
dbfilename:保存/加载数据库的文件名。默认为 "dump";
此外,还有 Dragonfly 特定的参数选项:
-
memcached_port:在此端口上启用 memcached 兼容的 API。默认禁用。
-
keys_output_limit:在keys 命令中返回的最大键数。默认为 8192。
-
keys 命令是危险命令。会截断结果以避免在获取太多key时内存溢出。
-
dbnum:select 支持的最大数据库数。
-
cache_mode:请参见下面的 缓存 部分。
-
hz:键到期评估频率。默认为 100。空闲时,使用较低的频率可以占用较少的 CPU资源,但这会导致清理过期键的速度下降。
-
save_schedule:以UTC 时间规范保存快照,格式:HH:MM(24 小时制时间)。默认为空""。
-
primary_port_http_enabled:如果为 true,则允许在主 TCP 端口上访问 http 控制台。默认为 true。
-
admin_port:如果设置,将在指定的端口上启用对控制台的管理访问。支持 HTTP 和 RESP 协议。默认禁用。
-
admin_bind:如果设置,将管理控制台 TCP 连接绑定到给定地址。支持 HTTP 和 RESP 协议。默认为any。
-
admin_nopass: 将管理控制台 TCP 连接绑定到给定地址。同时支持 HTTP 和 RESP 协议。
-
cluster_mode:支持集群模式。目前仅支持 emulated。默认为空""。
-
cluster_announce_ip:集群模式下向客户端公开的 IP。
启动脚本示例,包含常用选项:
./dragonfly-x86_64 --logtostderr --requirepass=youshallnotpass --cache_mode=true -dbnum 1 --bind localhost --port 6379 --save_schedule "*:30" --maxmemory=12gb --keys_output_limit=12288 --dbfilename dump.rdb要获取更多选项,如日志管理或TLS支持,请运行dragonfly --help。
要获取更多选项,如日志管理或TLS支持,请运行dragonfly --help。
四、开发路线和开发现状
目前,Dragonfly支持约185个Redis命令以及除cas之外的所有memcache命令。几乎达到了Redis 5 API的水平。下一个里程碑更新将会稳定基本功能并实现复刻API。如果发现需要的命令尚未实现,请提出一个Issue。
对于dragonfly-native复制技术,正在设计一种分布式日志格式,该格式将支持更高的速度。
在实现复制功能之后,将继续实现API 3-6中其他缺失的Redis命令。
五、设计决策
全新的缓存设计
Dragonfly采用单一的自适应缓存算法,该算法非常简单且具备高内存效率。可以通过使用--cache_mode=true参数来启用缓存模式。一旦启用了此模式,Dragonfly将会删除最低概率可能被使用的内容,但这只会在接近最大内存限制时发生。
相对准确的过期期限
过期范围限制最高为约4年。此外,对于大于134217727ms(大约37小时)的到期期限,毫秒精度级别(PEXPIRE/PSETEX等)会被简化到秒级。这种舍入的误差小于0.001%,希望这在长时间范围情况下是可以接受的。
原生HTTP控制台和兼容Prometheus的标准
默认情况下,Dragonfly允许通过其主TCP端口(6379)进行HTTP访问。没错,可以通过Redis协议或HTTP协议连接到Dragonfly - 服务器会在连接初始化期间自动识别协议。不妨在自己的浏览器中尝试一下。现在HTTP访问没有太多信息可供参考,但在将来,计划添加有用的调试和管理信息。
重要!HTTP控制台仅应在安全网络内访问。如果将Dragonfly的TCP端口暴露在外部,则建议使用--http_admin_console=false或--nohttp_admin_console禁用控制台。
这篇关于全世界最快的内存数据库Dragonfly的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!