本文主要是介绍《图数据库》(人民邮电出版社)读书笔记四,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
第四章 构建基于图数据库的应用
看这章的时候由于有些基础知识的欠缺,看得我有些晕晕乎乎的……
图数据库应用程序非常适合使用演化的、增量的、迭代的软件开发实践方法进行开发。这些实践的一个关键特性是:整个软件开发生命周期中贯穿着测试。
有些需要向数据提出的问题能帮助我们定义实体和联系。敏捷软件开发中的用户故事表达应用程序需求由外向内、以用户为中心的观点提供了一种简洁的方式。敏捷用户故事还
提供了满足需求过程中出现的问题。
在遍历中对图进行大量剪枝的最好方法是使用不同的联系名称。如果使用一个或多个属性值来决定是否追随联系,会在第一次访问这些属性时带来额外的I/O,因为属性存储在独立于联系的存储文件中(不过之后它们会被缓存起来)。
当存在联系名称的闭集时,我们使用细粒度的联系。通过最小权重路径算法可以知道,权重很少能够组成一个闭集,因此权重通常适合表示为以属性限定的联系。
补:细粒度模型,通俗的讲就是将业务模型中的对象加以细分,从而得到更科学合理的对象模型,直观的说就是划分出很多对象。
当两个或多个领域实体在一段时间内进行交互,事实(fact)就出现了。我们用独立的节点表示这个事实,并将它们与产生这一事实的实体相关联。依据结果,即行为(action
)产生的那个事务,来建模行为,这将产生类似中间节点这样的结构:它是一个代表两个或多个实体之间的相互作用结果的节点。我们可以在中间节点上使用时间戳属性来表示
开始时间和结束时间。
值类型没有唯一标识,它的等价性完全取决于它的值。复杂的值类型是具有多少个字段或属性的值类型。多属性的值类型通常可以用单独的节点来表示。
时间在图中的两种建模技术:时间轴树和链表。
使用迭代式和增量式交付应用程序功能的方式开发的数据模型将完全不同于使用数据模型先行的方法开发的数据模型,但前一种数据模型将是正确的,因为它会由应用程序的需
求以及这些需求带来的问题来驱动。
如今大多数数据库是作为服务器并通过客户端库来访问的。Neo4则有点不寻常,它能够以嵌入式运行,也能以服务器模式运行——回顾到近十年前,它就是作为嵌入式图形数据库起源的。
在嵌入式模式下,Neo4j和应用程序运行于同一进程。嵌入式Neo4j的目标应用是硬件设备、桌面应用程序和应用服务器的组件。嵌入式模式有以下几个优点:
可参考:http://neo4j.com/docs/rest-docs/current/
服务器扩展使我们能在服务器内运行java代码。使用服务器扩展,我们可以扩展REST API,或完全取代它。
扩展采取JAX-RS注解类(annotated classe)的形式。JAX-RS是一个用于构建REST资源的Java API。
可参考:https://jax-rs-spec.java.net/
http://liugang594.iteye.com/blog/1491434
JAX-RS是一套用java实现REST服务的规范,提供了一些标注将一个资源类,一个POJOJava类,封装为Web资源。标注包括:
@Path,标注资源类或方法的相对路径
@GET,@PUT,@POST,@DELETE,标注方法是用的HTTP请求的类型
@Produces,标注返回的MIME媒体类型
@Consumes,标注可接受请求的MIME媒体类型
@PathParam,@QueryParam,@HeaderParam,@CookieParam,@MatrixParam,@FormParam,分别标注方法的参数来自于HTTP请求的不同位置,例如@PathParam来自于URL的路径,@QueryParam来自于URL的查询参数,@HeaderParam来自于HTTP请求的头信息,@CookieParam来自于HTTP请求的Cookie。
目前JAX-RS的实现包括:
Apache CXF,开源的Web服务框架。
Jersey, 由Sun提供的JAX-RS的参考实现。
RESTEasy,JBoss的实现。
Restlet,由Jerome Louvel和Dave Pawson开发,是最早的REST框架,先于JAX-RS出现。
Apache Wink,一个Apache软件基金会孵化器中的项目,其服务模块实现JAX-RS规范
Neo4j集群使用主从复制实现高可用性和水平读扩展。
所有集群的写入都通过主节点协调完成的,Neo4j也允许通过从节点进行写入操作,不过此时,被写入的从节点会先将数据同步到主节点,再将数据返回客户端。通过从节点写入会比直接写入主节点慢一个数量级。新版本的Neo4j在写入主节点时会将其复制到一个或多个从节点上,从而增加写入节点时的持久化保证。所以现在建议所有写入操作都通过主节点直接进行。
在高写入负载的情况中,可以使用队列来进行缓冲区写入和负载调节。
Neo4j自身没有负载均衡功能,而是依赖于网络基础设施的负载均衡能力。分离读写流量、高速缓存分片、读取自己的写入。
我们为每个测试创建的示例图都包括测试的设置或上下文。
随着时间的推移,我们就会建立起一套测试,它可以作为一种强有力的回归测试。随着应用程序的发展,当我们添加新的源数据,或是改变模型来满足新的需求时,回归测试套
件将持续断言自己有功能保持着它们本该表现的行为。演化的体系结构以及支持演化结构的增量、迭代的软件开发技术,是依赖于断言行为的。
测试不仅表现得像文档,而且也可以用于生成文档。Neo4j手册中所有Cypher文档都是由开发Cypher时写的单元测试自动生成的。
通过使用ImpermanentGraphDatabase,我们避免了在每次测试后清理磁盘上的存储文件这件事情。
ImpermanentGraphDatabase仅用在单元测试中。它是一个仅在内存版本的Neo4j,不能用于生产环境。
在测试Web应用程序的负载均衡性时,我们应该确保测试客户端分布在不同的IP地址以便通过集群来平衡请求。
图数据库使用磁盘进行持久化存储,使用主存储器进行图的片段缓存。
对大型数据导入,可以通过将一个大事务提交分解为一系列随后在数据库上连续执行的小事物提交来改善性能。可以使用PERIODIC COMMIT命令实现这个功能。
这篇关于《图数据库》(人民邮电出版社)读书笔记四的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!