cassandra学习笔记4--Cassandra Java客户端

2024-05-01 17:32

本文主要是介绍cassandra学习笔记4--Cassandra Java客户端,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

  现在开始深入了解一下cassandra的数据模型。cassandra是一种NoSQL数据库,NoSQL并不是指没有SQL语句,而是指No Relationalcassandra的数据模型结合了Dynamokey/valueBigTable
 
的面向列的特点,主要被设计为存储大规模的分布式数据。
     PS:图片在这里显示不全,why?要看图片,可以另存为或复制图片地址,在浏览器里打开。

一、cassandra数据模型的特点

        1.它基于key-value模型

        cassandra的数据库由ColumnFamilies组成,一个ColumnFamily是一个key-value键值对的集合。若和关系型数据库类比,ColumnFamily相当于表,而里面的key-value键值对相当于表里的一条记录。

        2.它的key-value模型有多层嵌套

        ColumnFamily里的每条记录都是一个key-value对,value部分存放的是无限制的Columns。每个Column都有一个Column Namevalue,因此Column实际也是一个key-value对。但Columnvalue部分已经是最基本的数据存储单元,不能再向下嵌套了。在这种嵌套下,ColumnFamily的每条记录都包含一个key和一个由Columns组成的value(至少有一个Column),也就是说ColumnFamilyvalue只是一个中间人,实际存储数据的是value里的Columns。如下图所示。


        上面所说的是双层嵌套,还有一种三层嵌套。在这种情况下,ColumnFamily每条记录的value部分不是Columns,而是一种被称为SuperColumn的结构。SuperColumnkeySuperColumn name,它的value部分可以存储多个Columns,如下图所示:


        这样就有以下三种嵌套:

[java]  view plain copy
  1. ColumnFamily: key - value(SuperColumn)  
  2. SuperColumn: key(SuperColumn name) - value(Column)  
  3. Column: key(Column name) - value  

        SuperColumn里不能再存储SuperColumn,因此cassandra的嵌套最多为三层。

        3.ColumnSuperColumnname部分都可以用来存储实际数据

        首先,它们的name部分可以用来当做属性名。比如在一个存储用户邮箱的记录里,它是这样的:

[java]  view plain copy
  1. Column name=Email,value="fykhlp@163.com";  

        这是我们在传统关系型数据库里所习惯和使用的。但在cassandra里,name部分也可以直接用来存储实际数据。比如在一个只用来存储用户邮箱的记录里,我们可以这样:

[java]  view plain copy
  1. Column name="fykhlp@163.com",value=null;  

        这得益于(a)cassandra的非结构化数据存储,数据的存储不需要固定的位置(b)name部分也是使用字节流存储(关系型数据库的字段名必须是字符),因此可以存储任何类型的数据。

        4.ColumnSuperColumn按照name的顺序存储

        需要注意的是,cassandra并不是按照value的顺序存储数据,而是按照name。关于这点下文会详细说明。

二、cassandra数据模型的构成

        在这一部分,将详细讲解cassandra数据模型的各个组成部分。

        1.Column

        Column是数据存储的最小单位。它是一个包括namevaluetimestamp(时间戳)的元祖。下面是一个Column的示例:

[java]  view plain copy
  1. {  
  2.     name:"age",  
  3.     value:24,  
  4.     timestamp:123456789  
  5. }  

        方便书写,后文将省略时间戳,我们将Column看成一个name-value对。namevalue都是字节流,长度没有限制。

        2.SuperColumn

        一个SuperColumn是一个真正的name-value对,它没有时间戳。而且它的value部分可以包含无限个Column并且用Columnname部分作为关键字。下面是一个SuperColumn的示例:

[java]  view plain copy
  1. {  
  2.     name:"homeAddress"  
  3.     //value部分是多个Columns  
  4.     value:  
  5.     //这里的key是Column的name部分  
  6.     street:{name:"street",value:"XiTuCheng road"},  
  7.     city:{name:"city",value:"BeiJing"},  
  8.     zip:{name:"zip",value:"410083"},  
  9. }  

        在后面,不再写出namevalue,上文将简写为:

[java]  view plain copy
  1. homeAddress:{  
  2.     street:"XiTuCheng road",  
  3.     city:"BeiJing",  
  4.     zip:"410083",  
  5. }  

        3.Row

        在介绍下文的ColumnFamily前,我们先熟悉一下Row。在cassandra里,每个ColumnFamily都存在一个单独的文件里,这个文件以Row为单位存储并排序。因此,我们应尽量将相关的Column放在同一个ColumnFamily里。

        ColumnFamily的组成是一行行的Row,一个Row就是一个key-value对,key决定数据将被存在哪台机器上(笔记二的token部分有解释),value部分就是ColumnsSuperColumns

        4.ColumnFamily

        ColumnFamily是一个可以包含无数个Row的结构,又因为Rowvalue部分是ColumnsSuperColumns,因此ColumnFamily实际是ColumnsSuperColumns的容器。ColumnFamily对应关系型数据库里的“表”。下面给出ColumnFamilyRow的一个简单示例(使用Column):

[java]  view plain copy
  1. User={//这是一个ColumnFamily,名字是User  
  2.     zhangsan:{//这是一个Row,Row的key是zhangsan  
  3.     //下面的value可以有无限制的Columns,这里有两个  
  4.         username:"zhangsan",  
  5.         email:"zhangsan@163.com",  
  6.     },//这个Row结束了  
  7.     lisi:{//这是第二个Row,Row的key是lisi  
  8.     //value部分,依然是Columns,lisi有三个  
  9.         username:"lisi",  
  10.         email:"lisi@163.com",  
  11.         phone:"123456"  
  12.     },//Row结束  
  13. }  

        又如下图所示:


        在这个层面没有设计模式的要求,Row没有预先定义它们应该包含的Columns列表,就如上面的示例,李四可以随意的多一个phoneColumn。一个Row可能有成千上万个Columns而另一个Row可能只有一个Columncassandra在这一点上有无法比拟的灵活性。

        5.属性为SuperColumnFamily

        上面的示例是一个type为标准的(StandardColumnFamily,另外也有SuperColumnFamily,这取决于我们创建ColumnFamily时的定义。顾名思义,一个类型为SuperColumnFamilyRow存储的不是Columns,而是SuperColumns。在这种情况下,一个Rowvalue部分有若干个SuperColumns,一个SuperColumnsvalue部分又有若干个Columns。如下图所示:


        为什么要有SuperColumn呢?SuperColumn提供了比普通Column多一级的一对多关系。Column只能让一个key存储一组相关联的Columns,而这个能让一个key存储多组相关联的Columns

        这里给出一个应用:假设我们提供一种网上地址本的服务,用户可以在这保存他的朋友们的地址,而地址又是由不同的属性如邮编、街道、城市等组成。这时候我们可以采用SuperColumn。对于ColumnFamily,它的key使用的是用户自己的名字,value部分是若干SuperColumns。每个SuperColumnsname部分是用户某个朋友的名字,value部分是若干Columns,存储地址的各个属性。下面是示例:

[java]  view plain copy
  1. AddressBook={//这是一个SuperColumnFamily,名字是AddressBook  
  2.       
  3.     zhangsan:{//这是一个Row,key是zhangsan,张三的地址本  
  4.     //下面是Row的Value部分,可以有任意个SuperColumns  
  5.         lisi:{//这是SuperColumn的name  
  6.             //下面是Columns,表示地址  
  7.             street:"XiTuCheng road",  
  8.             zip:"410083",  
  9.             city:"BeiJing"  
  10.         },  
  11.         wangwu:{//另一个SuperColumn  
  12.             street:"XiTuCheng road",  
  13.             zip:"410083",  
  14.             city:"BeiJing"  
  15.         },  
  16.         zhaoliu:{//SuperColumn  
  17.             street:"XiTuCheng road",  
  18.             zip:"410083",  
  19.             city:"BeiJing"  
  20.         },  
  21.         .......  
  22.     }//end the row of zhangsan  
  23.       
  24.     lisi:{//这是另一个Row,key是lisi,李四的地址本  
  25.         wangwu:{//SuperColumn  
  26.             street:"XiTuCheng road",  
  27.             zip:"410083",  
  28.             city:"BeiJing"  
  29.         },  
  30.         zhangsan:{//SuperColumn  
  31.             street:"XiTuCheng road",  
  32.             zip:"410083",  
  33.             city:"BeiJing"  
  34.         },  
  35.         .......  
  36.     }  
  37. }  

        6.KeySpace

        KeySpace是最外层的容器,也是最大的容器,通常一个应用程序对应一个KeySpace。所有的ColumnFamily都位于一个KeySpace里面,它相当于关系数据库里的DB

三、cassandra的数据排序

        前面所介绍的是cassandra里各种数据容器的概念,现在来看看数据模型的另外一个关键地方即数据是如何排序的。cassandra和关系型数据库不同,你无法在取出数据时指定一种排序(order by)。数据在你存储到集群,被写入数据库时已经按照预定的规则被排好序。当你取出数据时,它们的顺序已经确定了。

        如前问所说,cassandra是按照name而不是value进行排序。cassandra在写入数据的时候,每个row中的所有Columns会按照name自动排好序。排序的规则由ColumnFamilyCompareWith选项确定,可选的有:BytesTypeUTF8TypeLexicalUUIDTypeTimeUUIDTypeAsciiTypeLongType。这些选项将Column Name看作不同的数据类型来排序,如LongType将它视为64bit Long类型。如下面给出的例子:

[java]  view plain copy
  1. {name: 123, value: “hello there”},  
  2. {name: 832416, value: “kjjkbcjkcbbd”},  
  3. {name: 3, value: “101010101010″},  
  4. {name: 976, value: “kjjkbcjkcbbd”}  

        采用LongType排序类型,结果是:

[java]  view plain copy
  1. {name: 3, value: “101010101010″},  
  2. {name: 123, value: “hello there”},  
  3. {name: 976, value: “kjjkbcjkcbbd”},  
  4. {name: 832416, value: “kjjkbcjkcbbd”}  

        采用UTF8Type排序类型,结果是:

[java]  view plain copy
  1. {name: 123, value: “hello there”},  
  2. {name: 3, value: “101010101010″},  
  3. {name: 832416, value: “kjjkbcjkcbbd”},  
  4. {name: 976, value: “kjjkbcjkcbbd”}  

        这些排序规则也适用于SuperColumnsRow内的排序,但对于SuperColumn内的Columns,用来定义排序规则的参数不再是RowSuperColumn里的CompareWith,而是CompareSubcolumnsWith

        我们可以自定义排序规则,实现接口org.apache.cassandra.db.marsha1.IType即可。


这篇关于cassandra学习笔记4--Cassandra Java客户端的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/952265

相关文章

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

JVM 的类初始化机制

前言 当你在 Java 程序中new对象时,有没有考虑过 JVM 是如何把静态的字节码(byte code)转化为运行时对象的呢,这个问题看似简单,但清楚的同学相信也不会太多,这篇文章首先介绍 JVM 类初始化的机制,然后给出几个易出错的实例来分析,帮助大家更好理解这个知识点。 JVM 将字节码转化为运行时对象分为三个阶段,分别是:loading 、Linking、initialization

Spring Security 基于表达式的权限控制

前言 spring security 3.0已经可以使用spring el表达式来控制授权,允许在表达式中使用复杂的布尔逻辑来控制访问的权限。 常见的表达式 Spring Security可用表达式对象的基类是SecurityExpressionRoot。 表达式描述hasRole([role])用户拥有制定的角色时返回true (Spring security默认会带有ROLE_前缀),去

浅析Spring Security认证过程

类图 为了方便理解Spring Security认证流程,特意画了如下的类图,包含相关的核心认证类 概述 核心验证器 AuthenticationManager 该对象提供了认证方法的入口,接收一个Authentiaton对象作为参数; public interface AuthenticationManager {Authentication authenticate(Authenti

Spring Security--Architecture Overview

1 核心组件 这一节主要介绍一些在Spring Security中常见且核心的Java类,它们之间的依赖,构建起了整个框架。想要理解整个架构,最起码得对这些类眼熟。 1.1 SecurityContextHolder SecurityContextHolder用于存储安全上下文(security context)的信息。当前操作的用户是谁,该用户是否已经被认证,他拥有哪些角色权限…这些都被保

Spring Security基于数据库验证流程详解

Spring Security 校验流程图 相关解释说明(认真看哦) AbstractAuthenticationProcessingFilter 抽象类 /*** 调用 #requiresAuthentication(HttpServletRequest, HttpServletResponse) 决定是否需要进行验证操作。* 如果需要验证,则会调用 #attemptAuthentica

Spring Security 从入门到进阶系列教程

Spring Security 入门系列 《保护 Web 应用的安全》 《Spring-Security-入门(一):登录与退出》 《Spring-Security-入门(二):基于数据库验证》 《Spring-Security-入门(三):密码加密》 《Spring-Security-入门(四):自定义-Filter》 《Spring-Security-入门(五):在 Sprin

Java架构师知识体认识

源码分析 常用设计模式 Proxy代理模式Factory工厂模式Singleton单例模式Delegate委派模式Strategy策略模式Prototype原型模式Template模板模式 Spring5 beans 接口实例化代理Bean操作 Context Ioc容器设计原理及高级特性Aop设计原理Factorybean与Beanfactory Transaction 声明式事物

【前端学习】AntV G6-08 深入图形与图形分组、自定义节点、节点动画(下)

【课程链接】 AntV G6:深入图形与图形分组、自定义节点、节点动画(下)_哔哩哔哩_bilibili 本章十吾老师讲解了一个复杂的自定义节点中,应该怎样去计算和绘制图形,如何给一个图形制作不间断的动画,以及在鼠标事件之后产生动画。(有点难,需要好好理解) <!DOCTYPE html><html><head><meta charset="UTF-8"><title>06