摘要:取模主要是为了能够平均的落在每个数组上面。在多线程的情况下,会造成死循环。把先暂存单线程情况,创建一个对象参见方法,然后把引入给数组的位置。队头插入的效率高,如果队尾插入,还要遍历链表。此时,线程执行以下代码。
数据结构
table,Entry类型数组的数据
Entry,包括了key,value,Entry,以及hash
</>复制代码
final K key;
V value;
Entry next;
int hash;
put方法
</>复制代码
public V put(K key, V value) {
if (table == EMPTY_TABLE) {
inflateTable(threshold);
}
if (key == null)
return putForNullKey(value);//见putForNullKey方法
int hash = hash(key);
int i = indexFor(hash, table.length);//见indexFor方法,取模
for (Entry e = table[i]; e != null; e = e.next) {//遍历落在取模的数组上,遍历链表
Object k;
if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {//判断hash值一样,并且key也要一样
V oldValue = e.value;
e.value = value;
e.recordAccess(this);
return oldValue;
}
}
modCount++;
addEntry(hash, key, value, i);//见addEntry方法
return null;
}
putForNullKey方法
key为空的情况,在数组的第一个位置的链表遍历查找,如果有key为空,返回相应的值,如果没有,添加到链表后面。
</>复制代码
private V putForNullKey(V value) {
for (Entry e = table[0]; e != null; e = e.next) {
if (e.key == null) {
V oldValue = e.value;
e.value = value;
e.recordAccess(this);
return oldValue;
}
}
modCount++;
addEntry(0, null, value, 0);
return null;
}
indexFor方法
注释已经提醒了,length长度必须是2的非0幂数,h & (length-1)是对h%length的意思(length长度为2的非0幂数时有效)。比如123243423 % 16的值是15,123243423 & 15也是15,当然123243423是我随便打的。取模主要是为了能够平均的落在每个数组上面。
</>复制代码
static int indexFor(int h, int length) {
// assert Integer.bitCount(length) == 1 : "length must be a non-zero power of 2";
return h & (length-1);
}
addEntry方法
</>复制代码
void addEntry(int hash, K key, V value, int bucketIndex) {
//扩容为2倍长度,跟上面取模要求的一样,乘以2也是2的非0幂数
if ((size >= threshold) && (null != table[bucketIndex])) {
resize(2 * table.length);
hash = (null != key) ? hash(key) : 0;
bucketIndex = indexFor(hash, table.length);
}
createEntry(hash, key, value, bucketIndex);//见createEntry方法
}
createEntry方法
</>复制代码
void createEntry(int hash, K key, V value, int bucketIndex) {
Entry e = table[bucketIndex];//取到数组的位置的entry
table[bucketIndex] = new Entry<>(hash, key, value, e);//新entry加到链表的头部,并把数组指向新entry
size++;
}
/**
* Creates new entry.
*/
Entry(int h, K k, V v, Entry n) {
value = v;
next = n;
key = k;
hash = h;
}
get方法
</>复制代码
public V get(Object key) {
if (key == null)
return getForNullKey();
Entry entry = getEntry(key);//见getEntry方法
return null == entry ? null : entry.getValue();
}
getForNullKey方法
</>复制代码
private V getForNullKey() {
if (size == 0) {
return null;
}
for (Entry e = table[0]; e != null; e = e.next) {//因为put的时候,直接放数组的第一个,所以查询的时候,也查询第一个
if (e.key == null)
return e.value;
}
return null;
}
getEntry方法
</>复制代码
final Entry getEntry(Object key) {
if (size == 0) {
return null;
}
int hash = (key == null) ? 0 : hash(key);//先取hash
for (Entry e = table[indexFor(hash, table.length)];//取模,找到数组位置,然后遍历链表
e != null;
e = e.next) {
Object k;
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))//判断hash和key都相等
return e;
}
return null;
}
transfer方法
这个方法在调用put的时候,在resize扩容的时候调用。在多线程的情况下,会造成死循环。
</>复制代码
void transfer(Entry[] newTable, boolean rehash) {
int newCapacity = newTable.length;
for (Entry e : table) {
while(null != e) {
Entry next = e.next;//把next先暂存
if (rehash) {
e.hash = null == e.key ? 0 : hash(e.key);
}
int i = indexFor(e.hash, newCapacity);
e.next = newTable[i];
newTable[i] = e;
e = next;
}
}
}
单线程情况:
1、put("a",1),创建一个entry对象(参见createEntry方法),然后把引入给数组0的位置。
2、put("b",1),再创建一个entry对象,然后新对象的next指向旧的entry对象,最后数组指向新entry。队头插入的效率高,如果队尾插入,还要遍历链表。
3、如果扩容到4,参加transfer方法,依然采用队头插入,也就是说,如果链表是1,2,3,4,那么插入后就变成4,3,2,1。
现创建一个表,取到链表数据,开始遍历。这里假设都到index为3的数组。
Entry
e.next = newTable[i]时,这个e是key为b的entry
newTable[i] = e;执行完后,index为3的数组执行b。
现在执行暂存的a
继续执行上面几个步骤,完成扩容,结果如下:
我们设想一下,如果两个线程同时进行扩容,A线程获取key为b的entry的时候,时间分片到了,现在线程B线程执行,完成上面单线程的情况。
此时,A线程执行以下代码。
</>复制代码
e.next = newTable[i];
newTable[i] = e;
e = next;
e.next = newTable[i];的时候,此时b的next指向a
newTable[i] = e;的时候
可以看到,index为3的指向b,b的next指向a,a的next指向b。当有get操作,并且hash也落在index为3的时候,就死循环了。
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。
转载请注明本文地址:https://www.ucloud.cn/yun/75461.html
摘要:之前,其内部是由数组链表来实现的,而对于链表长度超过的链表将转储为红黑树。非线程安全,即任一时刻可以有多个线程同时写,可能会导致数据的不一致。有时两个会定位到相同的位置,表示发生了碰撞。 原文地址 HashMap HashMap 是 Map 的一个实现类,它代表的是一种键值对的数据存储形式。 大多数情况下可以直接定位到它的值,因而具有很快的访问速度,但遍历顺序却是不确定的。 HashM...
摘要:值得位数有的次方,如果直接拿散列值作为下标访问主数组的话,只要算法比较均匀,一般是很难出现碰撞的。但是内存装不下这么大的数组,所以计算数组下标就采取了一种折中的办法,就是将得到的散列值与数组长度做一个与操作。 hashMap简单介绍 hashMap是面试中的高频考点,或许日常工作中我们只需把hashMap给new出来,调用put和get方法就完了。但是hashMap给我们提供了一个绝佳...
摘要:但是还会有统计数问题和数据丢失问题。中使用了保证线程安全,但是在中又把它优化掉了,直接使用 一、开篇 HashMap、CurrentHashMap 面试时都要问烂了,用也用烂了。但是网上的解析要不就是不够全面,要么就是copy来copy去,连基于JDK版本有的都很混乱。这篇文章带你解析 基于jdk1.7、jdk1.8不同的hashMap和ConcurrentHashMap简略分析(很多...
摘要:发生了线程不安全情况。本来在中,发生哈希冲突是可以用链表法或者红黑树来解决的,但是在多线程中,可能就直接给覆盖了。中,当同一个值上元素的链表节点数不小于时,将不再以单链表的形式存储了,会被调整成一颗红黑树。 showImg(https://segmentfault.com/img/bVbsVLk?w=288&h=226); List 和 Set 的区别 List , Set 都是继承自...
阅读 3842·2021-11-11 10:58
阅读 2640·2021-09-22 15:43
阅读 2932·2019-08-30 15:44
阅读 2310·2019-08-30 13:08
阅读 1919·2019-08-29 17:28
阅读 973·2019-08-29 10:54
阅读 753·2019-08-26 11:46
阅读 3573·2019-08-26 11:43