Java集合源码深度解析：揭秘高效数据结构背后的

2024-12-30 13:52:15

在Java编程中，集合类库（Collections Framework）扮演着至关重要的角色。它为我们提供了丰富的数据结构，如List、Set、Map等，极大地简化了我们的编程工作。然而，对于初学者来说，了解这些数据结构的底层实现原理，即Java集合源码，往往是一个难点。本文将深入剖析Java集合源码，带您领略高效数据结构背后的奥秘。

一、Java集合概述

Java集合类库主要包括以下几类接口：

1.Collection：集合的顶级接口，代表一组对象，不保证元素的唯一性。

2.List：实现了Collection接口，允许元素重复，并提供顺序。

3.Set：实现了Collection接口，不允许元素重复，用于存储不重复的元素。

4.Queue：实现了Collection接口，用于存储元素的先进先出（FIFO）队列。

5.Deque：实现了Queue接口，提供双向队列功能。

6.Map：存储键值对，键不能重复。

7.SortedSet、SortedMap：分别对应Set和Map，保证元素的有序性。

二、Java集合源码解析

1.ArrayList

ArrayList是基于动态数组实现的可调整大小的数组。其源码如下：

`java public class ArrayList<E> extends AbstractList<E> implements List<E>, RandomAccess, Cloneable, java.io.Serializable { private static final long serialVersionUID = 8683452581122892189L;

private static final int DEFAULT_CAPACITY = 10;
private transient Object[] elementData;
private int size;
public ArrayList() {
    this.elementData = DEFAULT_CAPACITY;
}
public ArrayList(int initialCapacity) {
    if (initialCapacity >= 0) {
        this.elementData = new Object[initialCapacity];
    } else {
        throw new IllegalArgumentException("Illegal Capacity: " + initialCapacity);
    }
}
public ArrayList(Collection<? extends E> c) {
    elementData = c.toArray();
    if ((size = elementData.length) != 0) {
        if (elementData.getClass() != Object[].class) {
            elementData = Arrays.copyOf(elementData, size, Object[].class);
        }
    } else {
        this.elementData = DEFAULT_CAPACITY;
    }
}
// ... 其他方法 ...

} `

从源码中可以看出，ArrayList内部使用一个Object数组来存储元素。当添加元素时，如果数组已满，则自动扩容。扩容策略为将原数组容量翻倍。

2.LinkedList

LinkedList是基于双向链表实现的可调整大小的列表。其源码如下：

`java public class LinkedList<E> extends AbstractSequentialList<E> implements List<E>, Deque<E>, Cloneable, java.io.Serializable { private static final long serialVersionUID = 8683452581122892189L;

private static final int DEFAULT_CAPACITY = 10;
transient int size;
transient Node<E> first;
transient Node<E> last;
// ... 其他方法 ...

} `

LinkedList内部使用Node类来存储元素，Node类包含前驱节点、后继节点和元素值。添加、删除元素时，只需修改相应节点的指针即可。

3.HashSet

HashSet是基于哈希表实现的不允许重复元素的集合。其源码如下：

`java public class HashSet<E> extends AbstractSet<E> implements Set<E>, Cloneable, java.io.Serializable { private static final long serialVersionUID = 1331126495179934782L;

private transient HashMap<E, Object> map;
public HashSet() {
    this.map = new HashMap<>();
}
public HashSet(int initialCapacity) {
    this.map = new HashMap<>(initialCapacity);
}
public HashSet(int initialCapacity, float loadFactor) {
    this.map = new HashMap<>(initialCapacity, loadFactor);
}
public HashSet(Collection<? extends E> c) {
    this.map = new HashMap<>(c);
}
// ... 其他方法 ...

} `

HashSet内部使用HashMap来存储元素，HashMap的键存储元素，值始终为PRESENT。当添加元素时，通过计算哈希值确定元素在HashMap中的位置。

4.HashMap

HashMap是基于哈希表实现的键值对映射表。其源码如下：

`java public class HashMap<K, V> extends AbstractMap<K, V> implements Map<K, V>, Cloneable, java.io.Serializable { private static final long serialVersionUID = 362498820763181265L;

static class Node<K, V> implements Map.Entry<K, V> {
    final K key;
    V value;
    Node<K, V> next;
    int hash;
    Node(int hash, K key, V value, Node<K, V> next) {
        this.hash = hash;
        this.key = key;
        this.value = value;
        this.next = next;
    }
    // ... 其他方法 ...
}
private static final int DEFAULT_INITIAL_CAPACITY = 16;
private static final float DEFAULT_LOAD_FACTOR = 0.75f;
transient Node<K, V>[] table;
transient int size;
// ... 其他方法 ...

} `

HashMap内部使用Node数组来存储键值对，每个Node包含键、值、哈希值和后继节点。当添加元素时，通过计算键的哈希值确定元素在数组中的位置。

三、总结

本文深入剖析了Java集合源码，从ArrayList、LinkedList、HashSet和HashMap四个常用数据结构入手，揭示了它们的高效实现原理。通过学习这些源码，我们可以更好地理解Java集合类库的工作原理，为我们在实际编程中的应用提供有力支持。