HashSet底层代码全面解析(1)
介绍HashSet
1.HashSet是Set接口的实现子类。
2.HashSet的底层其实是HashMap。
3.HashSet可以存放null,但是只能存放一个。
4.HashSet存放元素的顺序与取出元素的顺序不一致。
5.HashSet不能存放重复的元素。
举一个实例来证明上面的3,4,5观点
import java.util.HashSet;
public class HashSet_ {
public static void main(String[] args) {
HashSet hashSet = new HashSet();
hashSet.add("jack");
hashSet.add("tom");
hashSet.add("jack");
hashSet.add(null);
hashSet.add(null);
System.out.println(hashSet);
}
}
输出结果
[null, tom, jack]
先说明HashSet的底层存放元素结论
1、HashSet的底层是HashMap,HashMap的底层是数组+链表+红黑树。
2、添加元素时,先得到其hash值,然后转成索引值。
3、找到存储元素的数组table,看这个索引位置是否有元素。
4、如果没有,就直接加入。
5、如果有就需要调用equals方法,进行比较,如果相同就放弃添加,如果不同就添加到链表的最后。(注意:equals方法可以自己修改,如果加入的是字符串,就按字符串的equals方法比较内容是否相同,如果加入的是自定义对象,未重写equals方法,就按是否是同一对象进行比较)
6、如果其中一条链表的长度达到8,并且table的大小>= 64,数组+链表的结构就会树化,变成红黑树。
7、输出按索引值顺序,所以存放元素的顺序与取出元素的顺序不一致,null索引为0,tom索引为3,jack索引为14。
HashSet的底层示意图
说明HashSet的底层数组扩容结论
1、HashSet的底层是HashMap,第一次添加时table数组扩容至16,临界值(threshold)是16*加载因子(loadfactor)是0.75 = 12。
2、当table数组使用到12时,数组就会扩容2倍,到32,新的临界值就是32 * 0.75 = 24,以此类推。
3、如果其中一条链表的长度达到8