我是一名很普通的双非大三学生,跟很多同学一样,有着一颗想进大厂的梦。接下来的几个月内,我将坚持写博客,输出知识的同时巩固自己的基础,记录自己的成长和锻炼自己,备战2021暑期实习面试!奥利给!!
ArrayList 我们几乎每天都会使用到,本文就一起来看看同样是面试高频问到的ArrayList的相关知识吧。
其实ArrayList是很简单的, ArrayList 其实就是围绕底层 数组结构 ,各个 API 都是对数组的操作进行封装,看下图:
//默认数组大小10 private static final int DEFAULT_CAPACITY = 10; //数组使用的大小 private int size; //数组存放的容器 transient Object[] elementData; // non-private to simplify nested class access 复制代码
图中展示是长度为 8 的数组(为了画图方便,其实默认是10),长度从 1 开始计数,index 表示数组的下标,从 0 开始计数,elementData 表示数组本身。
源码中除了这两个概念,还有以下三个基本概念:
三种初始化办法: 无参数直接初始化、指定大小初始化、指定初始数据初始化
// 无参数构造器,默认是空数组 public ArrayList() { this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA; } // 指定大小初始化 public ArrayList(int initialCapacity) { if (initialCapacity > 0) { this.elementData = new Object[initialCapacity]; } else if (initialCapacity == 0) { this.elementData = EMPTY_ELEMENTDATA; } else { throw new IllegalArgumentException("Illegal Capacity: "+ initialCapacity); } } // 指定初始数据初始化 public ArrayList(Collection<? extends E> c) { //elementData 是保存数组的容器,默认为 null elementData = c.toArray(); //如果给定的集合(c)数据有值,则进行拷贝赋值操作 if ((size = elementData.length) != 0) { //如果集合元素类型不是 Object 类型,才开始拷贝,否则不执行 if (elementData.getClass() != Object[].class) { elementData = Arrays.copyOf(elementData, size, Object[].class); } } else { // 给定集合(c)无值,则默认空数组 this.elementData = EMPTY_ELEMENTDATA; } } 复制代码
注意:ArrayList 无参构造器初始化时,默认大小是空数组,跟HashMap一样,都是在第一次 add 的时候扩容的数组值。
新增的代码其实很简短
// 添加到数组尾部 public boolean add(E e) { //确保数组大小足够,不够需要扩容 ensureCapacityInternal(size + 1); // Increments modCount!! //直接赋值,线程不安全的 elementData[size++] = e; return true; } // 添加到指定位置 public void add(int index, E element) { rangeCheckForAdd(index); ensureCapacityInternal(size + 1); // Increments modCount!! /** * @param src the source array. 源数组 * @param srcPos starting position in the source array. 源数组的起始位置 * @param dest the destination array. 目标数组 * @param destPos starting position in the destination data. 目标数组的起始位置 * @param length the number of array elements to be copied. 复制的长度 */ System.arraycopy(elementData, index, elementData, index + 1, size - index); elementData[index] = element; size++; } 复制代码
我们可以看到两个add方法,我们来分析一下这两个方法: 添加到数组尾部 时间复杂度O(1):
添加到指定位置时间复杂度O(n):
// 扩容 private void grow(int minCapacity) { int oldCapacity = elementData.length; // oldCapacity >> 1 是把 oldCapacity / (2 ^ 1) 的意思 int newCapacity = oldCapacity + (oldCapacity >> 1); // 如果扩容后的值 < 我们的期望值,扩容后的值就等于我们的期望值 if (newCapacity - minCapacity < 0) newCapacity = minCapacity; // 如果扩容后的值 > jvm 所能分配的数组的最大值,那么就去 Integer 的最大值 if (newCapacity - MAX_ARRAY_SIZE > 0) newCapacity = hugeCapacity(minCapacity); // 通过复制进行扩容 底层实际上还是System.arraycopy方法 elementData = Arrays.copyOf(elementData, newCapacity); } 复制代码
我们可以看到扩容是通过这行代码来实现的:Arrays.copyOf(elementData, newCapacity);,这行代码指的就是数组之间的拷贝,扩容是会先 新建一个预期容量的新数组 ,然后把 老数组的数据拷贝过去 ,底层还是System.arraycopy 方法进行拷贝,此方法是 native 的方法 这里需要注意:扩容的规则是 原来容量大小 + 容量大小的一半,也就是原来容量的 1.5 倍 ;ArrayList 中的数组的最大值是 Integer.MAX_VALUE。且 ArrayList 是允许 null 值的。
ArrayList 删除元素有很多种方式,比如 根据数组索引删除、根据值删除或批量删除 等等,原理和思路都差不多,我们选取根据值和下标删除方式来进行说明:
//根据数组下标去删除 public E remove(int index) { rangeCheck(index); modCount++; E oldValue = elementData(index); int numMoved = size - index - 1; if (numMoved > 0) System.arraycopy(elementData, index+1, elementData, index, numMoved); elementData[--size] = null; // 方便GC,防止造成内存溢出 return oldValue; } // 按值删除 public boolean remove(Object o) { // 如果要删除的值是 null,找到第一个值是 null 的删除 if (o == null) { for (int index = 0; index < size; index++) if (elementData[index] == null) { fastRemove(index); return true; } } else { // 如果要删除的值不为 null,找到第一个和要删除的值相等的删除 for (int index = 0; index < size; index++) // 这里是根据 equals 来判断值相等的,相等后再根据索引位置进行删除 if (o.equals(elementData[index])) { fastRemove(index); return true; } } return false; } 复制代码
我们需要注意的是:
总结: 我们可以看出其实新增和删除都涉及到了数组的复制,这也是为什么ArrayList适合查找,LinkedList适合新增删改,但是如果是直接添加到数组尾部的话,还是很快的。但是这是有条件的,也就是我们不指定位置直接添加元素时(add(E element)),元素会默认会添加在最后,不会触发底层数组的复制,不考虑底层数组自动扩容的话,时间复杂度为O(1) ,在指定位置添加元素(add(int index, E element)),需要复制底层数组,根据最坏打算,时间复杂度是O(n)。
我们都知道所有集合都是Collection接口的实现类,又因为Collection继承了Iterable接口,因此所有集合都是可迭代的。我们常常会采用集合的迭代器来遍历集合元素,我们来看看ArrayList对迭代器的实现,从而深入分析为什么对集合执行相关修改操作时为什么会抛出 ConcurrentModificationException 。
// 实现 Iterator 接口 private class Itr implements Iterator<E> { // 迭代过程中,下一个元素的位置,从 0 开始,用来控制拿下一个元素 int cursor; // 新增时表示上一次迭代过程中,索引的位置,删除成功时为 -1 int lastRet = -1; // 迭代过程中期望数组修改版本号 int expectedModCount = modCount; public boolean hasNext() {...} public E next() { //迭代过程中,判断版本号有无被修改,有被修改,抛 ConcurrentModificationException 异常 checkForComodification(); ... 省略代码 // 返回元素值 return (E) elementData[lastRet = i]; } public void remove() { //迭代过程中,判断版本号有无被修改,有被修改,抛 ConcurrentModificationException 异常 checkForComodification(); try { // 调用自身的remove ArrayList.this.remove(lastRet); ... 省略代码 expectedModCount = modCount; } catch (IndexOutOfBoundsException ex) { throw new ConcurrentModificationException(); } } // 对比迭代器的删除,你发现了什么? public E remove(int index) { ... 省略代码 modCount++; ... 省略代码 return oldValue; } 复制代码
该迭代器实现了Iterator接口并实现了相关方法,提供我们对集合的遍历能力。
总结:ArrayList的迭代器默认是其内部类实现,实现一个自定义迭代器只需要实现Iterator接口并实现相关方法即可。而实现Iterable接口表示该实现类具有像for-each loop迭代遍历的能力。
首先这里涉及到两个很重要的变量,一个是 expectedModCount ,另一个是 modCount , expectedModCount 在集合内部迭代器中定义,就像上面源码所示, modCount 在AbstractList中定义。,默认迭代器初始化的时候 expectedModCount = modCount
说明两者是相等的,我们可以看到next方法和remove方法都会去判断,只有当不相等的情况下才会抛出异常。我们可以看到ArrayList自身的remove方法在删除元素的时候会将modCount++,虽然迭代器本质上也是 this.remove
,但它在删除之后执行了一行 expectedModCount = modCount
,以此保证了两个值的相等,这也是java.util下的集合类的快速失败机制的实现。
总结: 迭代器迭代集合时不能对被迭代集合进行修改,原因是modCount和expectedModCount两个变量值不想等导致的!如果想删除需要调用Iterator.remove (),另外快速失败机制并不能保证ArrayList是线程安全的。
回顾一下,看完这篇文章你答的上以下问题了吗?