【CAP探索者指南】掌握分布式世界的三角平衡术,一致性、可用性、分区容错性大揭秘!

本文主要是介绍【CAP探索者指南】掌握分布式世界的三角平衡术,一致性、可用性、分区容错性大揭秘!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

关注微信公众号 “程序员小胖” 每日技术干货,第一时间送达!

引言

在现代的微服务架构中,系统被拆分成了许多小型服务,每个服务可能有自己的数据库。这种架构带来了灵活性和可扩展性,但也引入了新的挑战,尤其是在事务管理方面。分布式事务确保了在跨多个服务的操作中,所有事务的参与者要么全部成功提交,要么在遇到错误时全部回滚,从而保持了数据的最终一致性。

CAP理论

CAP理论是分布式系统设计中的一个核心原则,它指出在分布式系统中,一致性(Consistency)、可用性(Availability)和分区容错性(Partition tolerance)这三个特性无法同时完全满足。一个分布式系统只能满足这三个特性中的两个。

一致性(Consistency)

在分布式系统中,一致性意味着所有节点在同一时间看到的数据是相同的。当一个写操作完成后,所有节点在同一时间的数据完全一致,等同于所有节点拥有数据的最新版本。

可用性(Availability)

可用性强调分布式系统在任何时候都能够响应请求,即使在部分节点故障的情况下,系统也能够继续处理请求。

我们平时会看到一些 IT 公司的对外宣传,比如系统稳定性已经做到 3 个 9、4 个 9,即 99.9%、99.99%,这里的 N 个 9 就是对可用性的一个描述,叫做 SLA,即服务水平协议。比如我们说月度 99.95% 的 SLA,则意味着每个月服务出现故障的时间只能占总时间的 0.05%,如果这个月是 30 天,那么就是 21.6 分钟。

分区容错性(Partition tolerance)

当部分节点出现消息丢失或者分区故障的时候,分布式系统仍然能够继续运行,即系统容忍网络出现分区,并且在遇到某节点或网络分区之间网络不可达的情况下,仍然能够对外提供满足一致性和可用性的服务

使用场景分析

CA系统(一致性与可用性)

**场景:**需要强一致性的数据库系统,如关系型数据库 mysql。

**设计:**通过引入事务机制、两阶段提交等协议来保证一致性。在网络分区发生时,可能会牺牲一部分可用性,例如通过锁定机制来防止数据不一致。

由于严格的CA系统在分布式环境中难以实现,我们可以展示一个简化版的伪代码思路,模拟一个中心化服务,它在理想状态下提供了高可用性和强一致性。但请记住,这并不直接对应于真实的分布式系统设计。

// 简化模拟:中心化服务,模拟一致性与可用性优先
class CentralizedService {private Map<String, String> dataStore = new ConcurrentHashMap<>();// 写入数据,确保所有操作直接作用于单一存储源,保证一致性synchronized void put(String key, String value) {dataStore.put(key, value);}// 读取数据,直接从单一存储源读取,保证一致性String get(String key) {return dataStore.get(key);}
}public class CADemo {public static void main(String[] args) {CentralizedService service = new CentralizedService();// 模拟写操作new Thread(() -> {service.put("exampleKey", "exampleValue");}).start();// 模拟读操作new Thread(() -> {try {Thread.sleep(100); // 确保写操作先执行} catch (InterruptedException e) {e.printStackTrace();}System.out.println(service.get("exampleKey"));}).start();}
}

CP系统(一致性与分区容错性)

**场景:**对于数据一致性要求极高的系统,如金融交易系统 (ZooKeeper,Redis(Redis配置为主从复制且采用严格一致性模式时))。

**设计:**当网络分区发生时,系统可能会拒绝服务以保证数据一致性,直到网络分区问题解决。

//1.使用zookeeper 实现分布式锁
import org.apache.zookeeper.*;
import java.util.Collections;
import java.util.List;
import java.util.concurrent.CountDownLatch;public class DistributedLock {private final ZooKeeper zookeeper;private final String lockPath;private String currentLock;private CountDownLatch latch;public DistributedLock(ZooKeeper zookeeper, String lockPath) {this.zookeeper = zookeeper;this.lockPath = lockPath;}public boolean lock() throws KeeperException, InterruptedException {try {currentLock = zookeeper.create(lockPath + "/lock-", null, ZooDefs.Ids.OPEN_ACL_UNSAFE, CreateMode.EPHEMERAL_SEQUENTIAL);List<String> children = zookeeper.getChildren(lockPath, false);Collections.sort(children);if (currentLock.equals(lockPath + "/" + children.get(0))) {// 如果当前锁是最小的,则获取锁成功return true;} else {// 不是最小的锁,找到比自己小1的锁并监听它String prevLock = lockPath + "/" + children.get(Collections.binarySearch(children, currentLock.substring(lockPath.length() + 1)) - 1);latch = new CountDownLatch(1);zookeeper.exists(prevLock, event -> {if (event.getType() == Watcher.Event.EventType.NodeDeleted) {latch.countDown();}});latch.await(); // 阻塞等待锁释放return true; // 锁释放后尝试重新获取锁}} catch (KeeperException | InterruptedException e) {throw e;}}public void unlock() throws InterruptedException, KeeperException {zookeeper.delete(currentLock, -1);}
}//2.在业务逻辑处理中,利用上面的分布式锁确保每次更新操作的原子性和一致性:
public class InventoryManager {public void updateStock(int quantity, String productId) throws KeeperException, InterruptedException {DistributedLock lock = new DistributedLock(ZKConnection.zookeeper, "/inventoryLocks");lock.lock(); // 获取锁try {// 这里执行实际的库存更新逻辑,例如调用数据库更新接口System.out.println("Updating stock for product " + productId + " by " + quantity);// 更新库存代码...} finally {lock.unlock(); // 操作完成后释放锁}}
}

AP系统(可用性与分区容错性)

**场景:**对可用性要求较高的系统,如Web搜索、社交网络等 (es,redis(配置为异步复制时),MongoDB(默认配置))。

**设计:**在网络分区发生时,系统继续提供服务,但可能会读到过时的数据。通过最终一致性模型来保证数据最终达到一致的状态。

代码示例:简化版分布式缓存系统(偏向AP)

// 简化的Cache接口
interface Cache {void put(String key, String value);String get(String key);
}// 偏向AP的实现,使用HashMap模拟内存缓存
class DistributedCache implements Cache {private ConcurrentHashMap<String, String> cache = new ConcurrentHashMap<>();@Overridepublic void put(String key, String value) {// 简单的写入操作cache.put(key, value);}@Overridepublic String get(String key) {// 立即返回本地缓存的值,保证可用性return cache.get(key);}// 实际场景中还需考虑数据同步机制,例如使用最终一致性模型
}public class CAPDemo {public static void main(String[] args) {DistributedCache cache = new DistributedCache();cache.put("key", "value");System.out.println(cache.get("key")); // 即使在分区情况下,也能读取到旧值,体现了可用性}
}

对于多数大型互联网应用的场景,结点众多、部署分散,而且现在的集群规模越来越大,所以节点故障、网络故障是常态,而且要保证服务可用性达到N个9(99.99…%),并要达到良好的响应性能来提高用户体验,因此一般都会做出 如下选择:保证P和A,舍弃C强一致,保证最终一致性。

结语

在实际应用中,系统设计者需要根据业务需求和场景特点来决定哪些特性是优先考虑的,并据此做出合理的架构决策。例如,对于需要实时数据处理和高并发访问的互联网应用,可能会倾向于选择AP模型;而对于数据准确性和一致性要求极高的金融系统,则可能会选择CP模型。同时,随着技术的发展,一些新型的分布式系统设计如BASE模型(Basically Available, Soft state, Eventual consistency)提出了对CAP理论的补充,强调了最终一致性,以适应实际应用中的灵活性需求。

这篇关于【CAP探索者指南】掌握分布式世界的三角平衡术,一致性、可用性、分区容错性大揭秘!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/960884

相关文章

Java利用JSONPath操作JSON数据的技术指南

《Java利用JSONPath操作JSON数据的技术指南》JSONPath是一种强大的工具,用于查询和操作JSON数据,类似于SQL的语法,它为处理复杂的JSON数据结构提供了简单且高效... 目录1、简述2、什么是 jsONPath?3、Java 示例3.1 基本查询3.2 过滤查询3.3 递归搜索3.4

Spring Boot结成MyBatis-Plus最全配置指南

《SpringBoot结成MyBatis-Plus最全配置指南》本文主要介绍了SpringBoot结成MyBatis-Plus最全配置指南,包括依赖引入、配置数据源、Mapper扫描、基本CRUD操... 目录前言详细操作一.创建项目并引入相关依赖二.配置数据源信息三.编写相关代码查zsRArly询数据库数

MySQL大表数据的分区与分库分表的实现

《MySQL大表数据的分区与分库分表的实现》数据库的分区和分库分表是两种常用的技术方案,本文主要介绍了MySQL大表数据的分区与分库分表的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有... 目录1. mysql大表数据的分区1.1 什么是分区?1.2 分区的类型1.3 分区的优点1.4 分

SpringBoot启动报错的11个高频问题排查与解决终极指南

《SpringBoot启动报错的11个高频问题排查与解决终极指南》这篇文章主要为大家详细介绍了SpringBoot启动报错的11个高频问题的排查与解决,文中的示例代码讲解详细,感兴趣的小伙伴可以了解一... 目录1. 依赖冲突:NoSuchMethodError 的终极解法2. Bean注入失败:No qu

JavaScript错误处理避坑指南

《JavaScript错误处理避坑指南》JavaScript错误处理是编程过程中不可避免的部分,它涉及到识别、捕获和响应代码运行时可能出现的问题,本文将详细给大家介绍一下JavaScript错误处理的... 目录一、错误类型:三大“杀手”与应对策略1. 语法错误(SyntaxError)2. 运行时错误(R

Python使用date模块进行日期处理的终极指南

《Python使用date模块进行日期处理的终极指南》在处理与时间相关的数据时,Python的date模块是开发者最趁手的工具之一,本文将用通俗的语言,结合真实案例,带您掌握date模块的六大核心功能... 目录引言一、date模块的核心功能1.1 日期表示1.2 日期计算1.3 日期比较二、六大常用方法详

MySQL中慢SQL优化方法的完整指南

《MySQL中慢SQL优化方法的完整指南》当数据库响应时间超过500ms时,系统将面临三大灾难链式反应,所以本文将为大家介绍一下MySQL中慢SQL优化的常用方法,有需要的小伙伴可以了解下... 目录一、慢SQL的致命影响二、精准定位问题SQL1. 启用慢查询日志2. 诊断黄金三件套三、六大核心优化方案方案

redis+lua实现分布式限流的示例

《redis+lua实现分布式限流的示例》本文主要介绍了redis+lua实现分布式限流的示例,可以实现复杂的限流逻辑,如滑动窗口限流,并且避免了多步操作导致的并发问题,具有一定的参考价值,感兴趣的可... 目录为什么使用Redis+Lua实现分布式限流使用ZSET也可以实现限流,为什么选择lua的方式实现

使用Python高效获取网络数据的操作指南

《使用Python高效获取网络数据的操作指南》网络爬虫是一种自动化程序,用于访问和提取网站上的数据,Python是进行网络爬虫开发的理想语言,拥有丰富的库和工具,使得编写和维护爬虫变得简单高效,本文将... 目录网络爬虫的基本概念常用库介绍安装库Requests和BeautifulSoup爬虫开发发送请求解

SpringBoot整合MybatisPlus的基本应用指南

《SpringBoot整合MybatisPlus的基本应用指南》MyBatis-Plus,简称MP,是一个MyBatis的增强工具,在MyBatis的基础上只做增强不做改变,下面小编就来和大家介绍一下... 目录一、MyBATisPlus简介二、SpringBoot整合MybatisPlus1、创建数据库和