日常中我們經(jīng)常跟集合打交道擅憔,但是如何選擇對應的數(shù)據(jù)結(jié)構(gòu)常常搞不清楚鸵闪,今天我們就簡單看一下HashSet、TreeSet和LinkedHashSet的使用區(qū)別.
我們都知道暑诸,集合是不包含重復元素的蚌讼,這是我們選擇使用集合的一個重要的原因. 集合有三個我們常用到的實現(xiàn)類:HashSet, TreeSet and LinkedHashSet. 如何根據(jù)場景去選擇使用哪一種集合是讓人頭疼的問題. 簡而言之,如何你需要的是一個快速的集合辟灰,建議你使用HashSet,如果你需要的是一個排序集合篡石,請選擇TreeSet芥喇,如果你需要一套能夠存儲插入順序的集合,請使用LinkedHashSet。
1. Set接口
Set接口繼承Collection接口.在集合中不允許出現(xiàn)重復的元素凰萨,你可以簡單的添加继控,重復的元素會自動的被移除。
java-collection-hierarchy
2. HashSet vs. TreeSet vs. LinkedHashSet
HashSet使用哈希表實現(xiàn)的沟蔑,元素是無序的湿诊。添加、刪除操作時間復雜度都是O(1)瘦材。TreeSet內(nèi)部結(jié)構(gòu)是一個樹結(jié)構(gòu)(紅黑樹),元素是有序的仿畸,添加食棕、刪除操作時間復雜度為O(log(n)),并且提供了first(), last(), headSet(), tailSet()等方法來處理有序集合错沽。
LinkedHashSet是介于HashSet 和 TreeSet之間簿晓,內(nèi)部是一個雙向鏈表結(jié)構(gòu),所以它的插入是有序的千埃,時間復雜度是O(1)憔儿。
3. TreeSet 示例
TreeSet<Integer> tree = new TreeSet<Integer>();
tree.add(12);
tree.add(63);
tree.add(34);
tree.add(45);
Iterator<Integer> iterator = tree.iterator();
System.out.print("Tree set data: ");
while (iterator.hasNext()) {
System.out.print(iterator.next() + " ");
}
輸出是有序的:
Tree set data: 12 34 45 63
現(xiàn)在讓我們定義一個Dog類,如下:
class Dog {
int size;
public Dog(int s) {
size = s;
}
public String toString() {
return size + "";
}
}
往TreeSet中添加幾只dogs:
import java.util.Iterator;
import java.util.TreeSet;
public class TestTreeSet {
public static void main(String[] args) {
TreeSet<Dog> dset = new TreeSet<Dog>();
dset.add(new Dog(2));
dset.add(new Dog(1));
dset.add(new Dog(3));
Iterator<Dog> iterator = dset.iterator();
while (iterator.hasNext()) {
System.out.print(iterator.next() + " ");
}
}
}
編譯通過,但是運行時出錯了
Exception in thread "main" java.lang.ClassCastException: collection.Dog cannot be cast to java.lang.Comparable
at java.util.TreeMap.put(Unknown Source)
at java.util.TreeSet.add(Unknown Source)
at collection.TestTreeSet.main(TestTreeSet.java:22)
這是因為TreeSet是有序的放可,而Dog類不是有序的谒臼,我們需要將Dog類實現(xiàn)Comparable接口。
class Dog implements Comparable<Dog>{
int size;
public Dog(int s) {
size = s;
}
public String toString() {
return size + "";
}
@Override
public int compareTo(Dog o) {
return size - o.size;
}
}
輸出:
1 2 3
所以我們在使用TreeSet時候耀里,里面裝的元素一定是有序的蜈缤,否則就不應該選擇TreeSet。
4. HashSet 示例
HashSet<Dog> dset = new HashSet<Dog>();
dset.add(new Dog(2));
dset.add(new Dog(1));
dset.add(new Dog(3));
dset.add(new Dog(5));
dset.add(new Dog(4));
Iterator<Dog> iterator = dset.iterator();
while (iterator.hasNext()) {
System.out.print(iterator.next() + " ");
}
輸出:
5 3 2 1 4
5. LinkedHashSet 示例
LinkedHashSet<Dog> dset = new LinkedHashSet<Dog>();
dset.add(new Dog(2));
dset.add(new Dog(1));
dset.add(new Dog(3));
dset.add(new Dog(5));
dset.add(new Dog(4));
Iterator<Dog> iterator = dset.iterator();
while (iterator.hasNext()) {
System.out.print(iterator.next() + " ");
}
按插入的順序進行輸出:
2 1 3 5 4
6. 性能測試
public static void main(String[] args) {
Random r = new Random();
HashSet<Dog> hashSet = new HashSet<Dog>();
TreeSet<Dog> treeSet = new TreeSet<Dog>();
LinkedHashSet<Dog> linkedSet = new LinkedHashSet<Dog>();
// start time
long startTime = System.nanoTime();
for (int i = 0; i < 1000; i++) {
int x = r.nextInt(1000 - 10) + 10;
hashSet.add(new Dog(x));
}
// end time
long endTime = System.nanoTime();
long duration = endTime - startTime;
System.out.println("HashSet: " + duration);
// start time
startTime = System.nanoTime();
for (int i = 0; i < 1000; i++) {
int x = r.nextInt(1000 - 10) + 10;
treeSet.add(new Dog(x));
}
// end time
endTime = System.nanoTime();
duration = endTime - startTime;
System.out.println("TreeSet: " + duration);
// start time
startTime = System.nanoTime();
for (int i = 0; i < 1000; i++) {
int x = r.nextInt(1000 - 10) + 10;
linkedSet.add(new Dog(x));
}
// end time
endTime = System.nanoTime();
duration = endTime - startTime;
System.out.println("LinkedHashSet: " + duration);
}
從下面的輸出結(jié)果可以看出冯挎,HashSet是最快的底哥。
HashSet: 2244768
TreeSet: 3549314
LinkedHashSet: 2263320
雖然測試不夠準確,但能反映得出,TreeSet要慢得多,因為它是有序的房官。
hashset-treeset-linkedhashset