首页
Python
Java
前端
数据库
Linux
Chatgpt专题
开发者工具箱
hbz专题
【HBZ分享】MYSLQ保存MD5值应该用varchar还是char?
结论 使用char是最好的,因为MD5是固定长度,而char也正是保存固定长度类型。 为什么固定长度用char保存更好? 首先char是固定长度的,比如char(10)保存10个字符,那么当保存abc这3个字符时,char依然会占用10个字符空间,剩下7个是空字符。而varchar(10)就只会占用3个字符。char是固定长度,varchar是可变长度,即varchar具体长度要根据实际存储
阅读更多...
【HBZ分享】Kafka为什么性能非常高
Kafka性能高的原因 磁盘顺序读写:磁盘顺序读写的性能可以和内存相媲美,顺序读写不需要寻道时间,也不需要大幅旋转磁头找扇区,所以性能极高 零拷贝: 大幅降低了用户态与内核态之间的切换,从而减少了数据来回复制。 批量发送:kafka有一个buffer池来存储消息,当累积到一定大小 或者 达到了指定发送时间间隔,会一起把buffer中所有消息一起发送,避免一条条发送。 压缩技术:会压缩消息
阅读更多...
【HBZ分享】ES中的DLS命令使用
ES中常见的DLS关键字及命令的使用案例 match:匹配关键字,包含分词的模糊匹配,以及精准匹配 title: 字段的名称, elasticsearch要查的内容,即查询title中带有elasticsearch的文档GET /索引库名/_search {"query": {"match": {"title": "elasticsearch"}}} term:用于精确匹配一个指定字
阅读更多...
【HBZ分享】ES分词器的拆分规则 及 算法
ES分词器种类 常见的分词器,如Standard分词器、Simple分词器、Whitespace分词器、IK分词等,还支持自定义分词器(比如一些小国家的语言需要自定义分词器)ES默认就是Standard分词器 分词器在分词时的过程 标记化:分词器第一步是将文本拆分成单个标记(tokens), 就是单个的单词或中文词组,这个标记可以是单词,数组,特殊字符,中文词语等。 此时会包含一些分隔符,标
阅读更多...