對Java中HashMap和TreeMap的區別的深入理解

首先介紹一下什麼是Map。在數組中我們是通過數組下標來對其內容索引的,而在Map中我們通過對象來對對象進行索引,用來索引的對象叫做key,其對應的對象叫做value。這就是我們平時說的鍵值對。

對Java中HashMap和TreeMap的區別的深入理解

HashMap通過hashcode對其內容進行快速查找,而 TreeMap中所有的元素都保持着某種固定的順序,如果你需要得到一個有序的結果你就應該使用TreeMap(HashMap中元素的排列順序是不固定的)。

HashMap 非線程安全 TreeMap 非線程安全

線程安全

在Java裏,線程安全一般體現在兩個方面:

1、多個thread對同一個java實例的訪問(read和modify)不會相互干擾,它主要體現在關鍵字synchronized。如ArrayList和Vector,HashMap和Hashtable

(後者每個方法前都有synchronized關鍵字)。如果你在interator一個List對象時,其它線程remove一個element,問題就出現了。

2、每個線程都有自己的字段,而不會在多個線程之間共享。它主要體現在adLocal類,而沒有Java關鍵字支持,如像static、transient那樣。

ractMap抽象類和SortedMap接口

AbstractMap抽象類:(HashMap繼承AbstractMap)覆蓋了equals()和hashCode()方法以確保兩個相等映射返回相同的哈希碼。如果兩個映射大小相等、包含同樣的鍵且每個鍵在這兩個映射中對應的值都相同,則這兩個映射相等。映射的哈希碼是映射元素哈希碼的總和,其中每個元素是y接口的一個實現。因此,不論映射內部順序如何,兩個相等映射會報告相同的哈希碼。

SortedMap接口:(TreeMap繼承自SortedMap)它用來保持鍵的有序順序。SortedMap接口爲映像的視圖(子集),包括兩個端點提供了訪問方法。除了排序是作用於映射的鍵以外,處理SortedMap和處理SortedSet一樣。添加到SortedMap實現類的元素必須實現Comparable接口,否則您必須給它的'構造函數提供一個Comparator接口的實現。TreeMap類是它的唯一一份實現。

2.兩種常規Map實現

HashMap:基於哈希表實現。使用HashMap要求添加的鍵類明確定義了hashCode()和equals()[可以重寫hashCode()和equals()],爲了優化HashMap空間的使用,您可以調優初始容量和負載因子。

(1)HashMap(): 構建一個空的哈希映像

(2)HashMap(Map m): 構建一個哈希映像,並且添加映像m的所有映射

(3)HashMap(int initialCapacity): 構建一個擁有特定容量的空的哈希映像

(4)HashMap(int initialCapacity, float loadFactor): 構建一個擁有特定容量和加載因子的空的哈希映像

TreeMap:基於紅黑樹實現。TreeMap沒有調優選項,因爲該樹總處於平衡狀態。

(1)TreeMap():構建一個空的映像樹

(2)TreeMap(Map m): 構建一個映像樹,並且添加映像m中所有元素

(3)TreeMap(Comparator c): 構建一個映像樹,並且使用特定的比較器對關鍵字進行排序

(4)TreeMap(SortedMap s): 構建一個映像樹,添加映像樹s中所有映射,並且使用與有序映像s相同的比較器排序

3.兩種常規Map性能

HashMap:適用於在Map中插入、刪除和定位元素。

Treemap:適用於按自然順序或自定義順序遍歷鍵(key)。

4.總結

HashMap通常比TreeMap快一點(樹和哈希表的數據結構使然),建議多使用HashMap,在需要排序的Map時候才用TreeMap。

複製代碼 代碼如下:

import Map;

import table;

import ator;

import ;

import Map;

public class HashMaps {

public static void main(String[] args) {

Mapmap = new HashMap();

("a", "aaa");

("b", "bbb");

("c", "ccc");

("d", "ddd");

Iteratoriterator = et()ator();

while (ext()) {

Object key = ();

tln("(key) is :" + (key));

}

// 定義HashTable,用來測試

Hashtabletab = new Hashtable();

("a", "aaa");

("b", "bbb");

("c", "ccc");

("d", "ddd");

Iteratoriterator_1 = et()ator();

while (iterator_ext()) {

Object key = iterator_();

tln("(key) is :" + (key));

}

TreeMaptmp = new TreeMap();

("a", "aaa");

("b", "bbb");

("c", "ccc");

("d", "cdc");

Iteratoriterator_2 = et()ator();

while (iterator_ext()) {

Object key = iterator_();

tln("(key) is :" + (key));

}

}

}

運行結果如下:

(key) is :ddd

(key) is :bbb

(key) is :ccc

(key) is :aaa

(key) is :bbb

(key) is :aaa

(key) is :ddd

(key) is :ccc

(key) is :aaa

(key) is :bbb

(key) is :ccc

(key) is :cdc

HashMap的結果是沒有排序的,而TreeMap輸出的結果是排好序的。

下面就要進入本文的主題了。先舉個例子說明一下怎樣使用HashMap:

複製代碼 代碼如下:

import .*;

public class Exp1 {

public static void main(String[] args){

HashMap h1=new HashMap();

Random r1=new Random();

for (int i=0;i<1000;i++){

Integer t=new Integer(Int(20));

if (ainsKey(t))

((Ctime)(t))t++;

else

(t, new Ctime());

}

tln(h1);

}

}

class Ctime{

int count=1;

public String toString(){

return ring(count);

}

}

在HashMap中通過get()來獲取value,通過put()來插入value,ContainsKey()則用來檢驗對象是否已經存在。可以看出,和ArrayList的操作相比,HashMap除了通過key索引其內容之外,別的方面差異並不大。

前面介紹了,HashMap是基於HashCode的,在所有對象的超類Object中有一個HashCode()方法,但是它和equals方法一樣,並不能適用於所有的情況,這樣我們就需要重寫自己的HashCode()方法。下面就舉這樣一個例子:

複製代碼 代碼如下:

import .*;

public class Exp2 {

public static void main(String[] args){

HashMap h2=new HashMap();

for (int i=0;i<10;i++)

(new Element(i), new Figureout());

tln("h2:");

tln("Get the result for Element:");

Element test=new Element(5);

if (ainsKey(test))

tln((Figureout)(test));

else

tln("Not found");

}

}

class Element{

int number;

public Element(int n){

number=n;

}

}

class Figureout{

Random r=new Random();

boolean possible=Double()>0.5;

public String toString(){

if (possible)

return "OK!";

else

return "Impossible!";

}

}

在這個例子中,Element用來索引對象Figureout,也即Element爲key,Figureout爲value。在Figureout中隨機生成一個浮點數,如果它比0.5大,打印"OK!",否則打印"Impossible!"。之後查看Element(3)對應的Figureout結果如何。

結果卻發現,無論你運行多少次,得到的結果都是"Not found"。也就是說索引Element(3)並不在HashMap中。這怎麼可能呢?

原因得慢慢來說:Element的HashCode方法繼承自Object,而Object中的HashCode方法返回的HashCode對應於當前的地址,也就是說對於不同的對象,即使它們的內容完全相同,用HashCode()返回的值也會不同。這樣實際上違背了我們的意圖。因爲我們在使用 HashMap時,希望利用相同內容的對象索引得到相同的目標對象,這就需要HashCode()在此時能夠返回相同的值。在上面的例子中,我們期望 new Element(i) (i=5)與 Elementtest=newElement(5)是相同的,而實際上這是兩個不同的對象,儘管它們的內容相同,但它們在內存中的地址不同。因此很自然的,上面的程序得不到我們設想的結果。下面對Element類更改如下:

複製代碼 代碼如下:

class Element{

int number;

public Element(int n){

number=n;

}

public int hashCode(){

return number;

}

public boolean equals(Object o){

return (o instanceof Element) && (number==((Element)o)er);

}

}

在這裏Element覆蓋了Object中的hashCode()和equals()方法。覆蓋hashCode()使其以number的值作爲 hashcode返回,這樣對於相同內容的對象來說它們的hashcode也就相同了。而覆蓋equals()是爲了在HashMap判斷兩個key是否相等時使結果有意義(有關重寫equals()的內容可以參考我的另一篇文章《重新編寫Object類中的方法》)。修改後的程序運行結果如下:

h2:

Get the result for Element:

Impossible!

請記住:如果你想有效的使用HashMap,你就必須重寫在其的HashCode()。

還有兩條重寫HashCode()的原則:

[list=1]

不必對每個不同的對象都產生一個唯一的hashcode,只要你的HashCode方法使get()能夠得到put()放進去的內容就可以了。即"不爲一原則"。

生成hashcode的算法儘量使hashcode的值分散一些,不要很多hashcode都集中在一個範圍內,這樣有利於提高HashMap的性能。即"分散原則"。至於第二條原則的具體原因,有興趣者可以參考Bruce Eckel的《Thinking in Java》,在那裏有對HashMap內部實現原理的介紹,這裏就不贅述了。

掌握了這兩條原則,你就能夠用好HashMap編寫自己的程序了。不知道大家注意沒有,ct中提供的三個方法:clone(),equals()和hashCode()雖然很典型,但在很多情況下都不能夠適用,它們只是簡單的由對象的地址得出結果。這就需要我們在自己的程序中重寫它們,其實java類庫中也重寫了千千萬萬個這樣的方法。利用面向對象的多態性——覆蓋,Java的設計者很優雅的構建了Java的結構,也更加體現了Java是一門純OOP語言的特性。