转载

发表于 2020年05月14日
浏览 (509)
评论 (0)

Java中Set集合是如何实现添加元素保证不重复的？

点击上方蓝色“ 程序猿DD ”，选择“设为星标”

回复“ 资源 ”获取独家整理的学习资料！

来源 | 公众号「武培轩」

Java中Set集合是如何实现添加元素保证不重复的？

Set集合是一个无序的不可以重复的集合。今天来看一下为什么不可以重复。

Set是一个接口，最常用的实现类就是HashSet，今天我们就拿HashSet为例。

先简单介绍一下HashSet类

HashSet类实现了Set接口，其底层其实是包装了一个HashMap去实现的。HashSet采用HashCode算法来存取集合中的元素，因此具有比较好的读取和查找性能。

先看下HashSet的几个构造方法。

// 默认构造函数 底层创建一个HashMap
    public HashSet() {
        // 调用HashMap的默认构造函数，创建map
        map = new HashMap<E,Object>();
    }

    // 带集合的构造函数
    public HashSet(Collection<? extends E> c) {
        // 创建map。
        map = new HashMap<E,Object>(Math.max((int) (c.size()/.75f) + 1, 16));
        // 将集合(c)中的全部元素添加到HashSet中
        addAll(c);
    }

    // 指定HashSet初始容量和加载因子的构造函数
    public HashSet(int initialCapacity, float loadFactor) {
        map = new HashMap<E,Object>(initialCapacity, loadFactor);
    }

    // 指定HashSet初始容量的构造函数
    public HashSet(int initialCapacity) {
        map = new HashMap<E,Object>(initialCapacity);
    }

    HashSet(int initialCapacity, float loadFactor, boolean dummy) {
        map = new LinkedHashMap<E,Object>(initialCapacity, loadFactor);
    }

再来看HashSet中的声明。

private transient HashMap<E,Object> map;
 // 用来匹配Map中后面的对象的一个虚拟值
private static final Object PRESENT = new Object();

接下来就是我们的重点HashSet的add()方法，贴上源码。

    /**
     * 将元素e添加到HashSet中，也就是将元素e作为Key放入HashMap中
     *
     * @param e 要添加到HashSet中的元素
     * @return true 如果不包含该元素
     */
    public boolean add(E e) {
        return map.put(e, PRESENT)==null;
    }

从源码我们可以看出HashSet的add()方法又调用了HashMap中的put()方法，那我们再跳转到HashMap中的put()方法中。

    public V put(K key, V value) {
        // 倒数第二个参数false：表示允许旧值替换
        // 最后一个参数true：表示HashMap不处于创建模式
        return putVal(hash(key), key, value, false, true);
    }

HashMap中的put()方法又调用了putVal()方法来实现功能，再看putVal()的源码。

    final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        Node<K, V>[] tab;
        Node<K, V> p;
        int n, i;
        //如果哈希表为空，调用resize()创建一个哈希表，并用变量n记录哈希表长度
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;
        /**
         * 如果指定参数hash在表中没有对应的桶，即为没有碰撞
         * Hash函数，(n - 1) & hash 计算key将被放置的槽位
         * (n - 1) & hash 本质上是hash % n，位运算更快
         */
        if ((p = tab[i = (n - 1) & hash]) == null)
            //直接将键值对插入到map中即可
            tab[i] = newNode(hash, key, value, null);
        else {// 桶中已经存在元素
            Node<K, V> e;
            K k;
            // 比较桶中第一个元素(数组中的结点)的hash值相等，key相等
            if (p.hash == hash &&
                    ((k = p.key) == key || (key != null && key.equals(k))))
                // 将第一个元素赋值给e，用e来记录
                e = p;
                // 当前桶中无该键值对，且桶是红黑树结构，按照红黑树结构插入
            else if (p instanceof TreeNode)
                e = ((TreeNode<K, V>) p).putTreeVal(this, tab, hash, key, value);
                // 当前桶中无该键值对，且桶是链表结构，按照链表结构插入到尾部
            else {
                for (int binCount = 0; ; ++binCount) {
                    // 遍历到链表尾部
                    if ((e = p.next) == null) {
                        p.next = newNode(hash, key, value, null);
                        // 检查链表长度是否达到阈值，达到将该槽位节点组织形式转为红黑树
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            treeifyBin(tab, hash);
                        break;
                    }
                    // 链表节点的<key, value>与put操作<key, value>相同时，不做重复操作，跳出循环
                    if (e.hash == hash &&
                            ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }
            // 找到或新建一个key和hashCode与插入元素相等的键值对，进行put操作
            if (e != null) { // existing mapping for key
                // 记录e的value
                V oldValue = e.value;
                /**
                 * onlyIfAbsent为false或旧值为null时，允许替换旧值
                 * 否则无需替换
                 */
                if (!onlyIfAbsent || oldValue == null)
                    e.value = value;
                // 访问后回调
                afterNodeAccess(e);
                // 返回旧值
                return oldValue;
            }
        }
        // 更新结构化修改信息
        ++modCount;
        // 键值对数目超过阈值时，进行rehash
        if (++size > threshold)
            resize();
        // 插入后回调
        afterNodeInsertion(evict);
        return null;
    }

从源码中，我们可以看出将一个key-value对放入HashMap中时，首先根据key的hashCode()返回值决定该Entry的存储位置，如果两个key的hash值相同，那么它们的存储位置相同。如果这个两个key的equals比较返回true。那么新添加的Entry的value会覆盖原来的Entry的value，key不会覆盖。且HashSet中add()中 map.put(e, PRESENT)==null 为false，HashSet添加元素失败。因此,如果向HashSet中添加一个已经存在的元素，新添加的集合元素不会覆盖原来已有的集合元素。

往期推荐

百度开源的 71 个项目，看看你用过几个？

Spring Boot + Dataway ：接口不用写，配配就出来？

用Java写一个植物大战僵尸简易版！

GitHub发布重大更新，关系到所有程序员！

GitHub 热榜：文字识别神器，超轻量级中文 OCR！

听说你想从事中间件开发？

扫码登录是如何实现的？

扫一扫，关注我

一起学习，一起进步

Java中Set集合是如何实现添加元素保证不重复的？

原文 http://mp.weixin.qq.com/s?__biz=MzAxODcyNjEzNQ==&mid=2247490608&idx=3&sn=e596de341e25f403a73e1e084adf1974

正文到此结束

所属分类： Java 编程技术

本文标签： equals git App 参数 ACE HashMap node CTO 程序猿 http 本质 tab CEO 组织 src Spring Boot 源码 GitHub value lib id java UI key 开源 Collection spring map 遍历百度 HashSet HTML final IO 构造方法 https 程序员开发神器
版权声明： 本文为互联网转载文章，出处已在文章中说明(部分除外)。如果侵权，请联系本站长删除，谢谢。
本文海报： 生成海报一生成海报二

热门推荐

openfire数据库安装指南

浏览(15,205) 评论(0)
Caffe 深度学习框架上手教程

浏览(11,420) 评论(0)
ReactiveCocoa入门教程：第一部分

浏览(12,221) 评论(0)
开源HIDS-OSSEC使用实例:监测CC攻击

浏览(12,116) 评论(0)
Decorators in ES7

浏览(16,763) 评论(4)
用Electron（Atom编辑器的兄弟项目）开发桌面应用

浏览(29,699) 评论(0)
Windows下JetBrains CLion中文输出乱码的解决方法

浏览(13,160) 评论(1)
同步-@synchronized, NSLock, pthread, OSSpinLock性能比较

浏览(12,057) 评论(0)
【开班了】JAVA培训班正式招生

浏览(8,234) 评论(12)
Seaweedfs之Volume读请求重定向

浏览(26,382) 评论(3)

相关文章

阿里云首购8折

Loading...

其他链接

关于本站

本站定位：个人技术类博客

本站作用：写博客、记日志、闲聊扯淡鼓捣技术。

问题交流

[HBLOG]公众号

HBLOG

HBLOG