本文主要是介绍JavaConcurrency-如何理解线程安全的集合CurrentHashMap为例,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
如果多线程要并发修改一个数据结构
例如: 散列表,
很容易会破坏这个数据结构,
例如:
一个线程可能要开始向表中插入一个新元素,假定在调整散列表各个桶之间的链接关系的过程中,被剥夺了控制权。
如果另一个线程也开始比那里同一个链表,可能使用无效的链接并造成混乱,会爆出异常or陷入死循环。
可以选择锁来保护共享数据结构,但是选择线程安全的实现作为替代可能更容易
高效的映射,集合和队列:
java.util.concurrent包提供了映射,有序集和队列的高效实现:
ConcurrentHashMap
ConcurrentSkipListMap
ConcurrentSkipListSet
ConcurrentLinkedQueue
这些几何使用复杂的短发,通过允许并发地访问数据结构的不同部分来使竞争极小化。
线程安全集合的原子更新:
ConcurrentHashMap<String,Long> 让计数代码自增,下面的代码是不安全的:
long oldValue=map.get(word);
long newValue=oldValue == null ?1:oldValue+1;
map.put(word,newValue);
多线程操作的时候 get和put代码不会破坏数据结构,不过,由于操作序列不是原子的,所以结果不可预知
正确做法是使用ConcurrentHashMap的replace方法,它会以原子方式用一个新值替换原值,前提是之前没有其他线程把原值替换为其他值。并且必须一直这么做,直到replace成功。 这是一个CAS操作
do{long oldValue=map.get(word);long newValue=oldValue == null ?1:oldValue+1;
}while(!map.replace(word,oldValue,newValue))
还可以使用:
map.putIfAbsent(word,new LongAdder());
map.get(word).increment();
第一个语句确保有一个LongAdder可以完成原子自增。由于putIfAbsent 返回映射的值(可能是原来的值,或者是新设置的值),可以组合成一句:
map.putIfAbsent(word,new LongAdder().increment());
computer方法时可以提供一个键和一个计算新值得函数。这个函数接收键和相关联的值(如果没有值,则为null),它会计算新值。
例如:可以如下更新一个整数计数器的映射:
map.computer(word,(k,v)-> ==null? 1 : v+1);
注意 ConcurrentHashMap中不允许有null值。有很多方法都是用null值来指示映射中某个给定的键不存在。
另外还有computerIfPresent 和computeIfAbsent 方法:
他们分别只有在已经有原值的情况下计算新值 or 只有没有原值的情况下计算新值。可以如下更新一个LongAdder计数器映射:
map.computerIfAbsent(word,k->new LongAdder()).increment();
这与之前的putIfAbsent调用几乎一样的,不过LongAdder构造器只有确实需要一个新的计数器才会调用。
当新增一个键时通常需要做些特殊处理。利用merge方法可以非常方便地做到这一点。这个方法有一个参数表示键不存在时使用的初始值。
否则,就会调用你体统的函数来结合原值与初始值。
map.merge(word,1L,(existingValue,newValue) -> existingValue + newValue);
//或者更加简单的写为
map.merge(word,1L,Long::sum);
注意:如果传入computer or merge 的函数 返回null,将从映射中删除现有的条目。
使用computer or merge 时,要记住你提供的函数不能做太多的工作。这个函数运行时,可能会阻塞对映射的其他更新。当然,这个函数也不能更新映射的其他部分。
CurrentHashMap的批操作:
Java8为并发散列映射提供了批操作,即使有其他线程在处理映射,这些操作也能安全的执行,无需冻结当前映射的快照。
三种操作:
- 搜索(search)为每个键or值提供一个函数,直到函数生成一个非null的结果。然后搜索终止,返回这个函数的结果
- 规约(reduce)组合所有的键or值,这里要使用所提供的一个累加函数
- forEach为所有的键or值提供一个函数
每个操作都有4个版本:
operationKeys:处理键
operationValues:处理值
operation:处理键和值
operationEntries:处理MapEntry对象
对于上述各个操作,需要指定一个参数化阈值(threshold)。如果映射包含的元素多于这个阈值,就会并行完成批操作。
如果希望批操作在一个线程中运行,可以使用阈值LongMAX_VALUE。吐过希望佣金可能多的线程运行批操作,可以使用阈值1。
String result =map.search(threshold,(k,v)-> 1000? k:null);
找出第一个出现次数超过1000次的单词,result会这是为第一个匹配的单词,如果操作函数对所有输入都返回null,则返回null。
forEach方法有两种形式。第一个只为各个映射条目提供一个消费者函数,例如:
map.forEach(threshold,(k,v)-> System.out.println(k+"->"+v));
第二种形式还有一个转换器函数,这个函数要先提供,其结果会传递到消费者:
map.forEach(threshold,(k,v)->k+"->"+v,//TransformerSystem.out::println);//Consumer
转换器可以用作为一个过滤器,只要转换器返回null ,这个值就会被悄无声息的跳过。
例如,只打印有大于1000的条目:
map.forEach(threshold,(k,v)-> v>1000? k+"->"+v : null,// filter and transformerSystem.out::println);//the nulls are not passed to the consumer
reduce操作用一个累加函数组合其输入
例如:
可以如下计算所有值得总和:
Long sum =map.reduceValues(threshold,Long::sum);
和forEach类似,也可以提供一个转换器函数,
可以如下计算最长的键的长度:
Integer maxLength=map.reduceKeys(threshold,String::length,//TransformerInteger::max) //Accumulator
转换器可以作为一个过滤器,通过返回null来排除不想要的输入:
比如:
Long count =map.reduceValues(threshold,v -> v>1000 ? 1L : null,Long::sum);
如果map为null,或者所有条目都被滤掉,reduce操作会返回null。如果只有一个元素,则返回器转换结果,不会应用累加器。
对于int,long 和double输出还有相应的特殊化操作,分别有后缀ToInt,ToLong 和ToDouble。 需要把输入转化为一个基本类型值,并指定一个默认值和一个累加器函数。map为null时返回默认值。
long sum =map.reduceValuesToLong(threshold,Long::longValue,//Transformer to primitive type0,//Default value for empty mapLong::sum)//Primitive type accumulator
这篇关于JavaConcurrency-如何理解线程安全的集合CurrentHashMap为例的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!