Java中的集合(Collection)有兩類(lèi)隐岛,一類(lèi)是List猫妙,再有一類(lèi)是Set。前者集合內(nèi)的元素是有序的聚凹,元素可以重復(fù)割坠;后者元素?zé)o序,但元素不可重復(fù)妒牙。
要想保證元素不重復(fù)彼哼,可兩個(gè)元素是否重復(fù)應(yīng)該依據(jù)什么來(lái)判斷呢?這就是Object.equals方法了湘今。但是敢朱,如果每增加一個(gè)元素就檢查一 次,那么當(dāng)元素很多時(shí)摩瞎,后添加到集合中的元素比較的次數(shù)就非常多了拴签。也就是說(shuō),如果集合中現(xiàn)在已經(jīng)有1000個(gè)元素旗们,那么第1001個(gè)元素加入集合時(shí)蚓哩,它 就要調(diào)用1000次equals方法。這顯然會(huì)大大降低效率上渴。
于是岸梨,Java采用了哈希表的原理。哈希算法也稱(chēng)為散列算法驰贷,是將數(shù)據(jù)依特定算法直接指定到一個(gè)地址上盛嘿。這樣一來(lái),當(dāng)集合要添加新的元素時(shí)括袒,先調(diào)用這個(gè)元素的hashCode方法次兆,就一下子能定位到它應(yīng)該放置的物理位置上。如果這個(gè)位置上沒(méi)有元素锹锰,它就可以 直接存儲(chǔ)在這個(gè)位置上芥炭,不用再進(jìn)行任何比較了漓库;如果這個(gè)位置上已經(jīng)有元素了,就調(diào)用它的equals方法與新元素進(jìn)行比較园蝠,相同的話(huà)就不存了渺蒿;不相同,也就是發(fā)生了Hash key相同導(dǎo)致沖突的情況,那么就在這個(gè)Hash key的地方產(chǎn)生一個(gè)鏈表,將所有產(chǎn)生相同hashcode的對(duì)象放到這個(gè)單鏈表上去,串在一起彪薛。所以這里存在一個(gè)沖突解決的問(wèn)題(很少出現(xiàn))茂装。這樣一來(lái)實(shí)際調(diào)用equals方法的次數(shù)就大大降低了,幾乎只需要一兩次善延。
所以少态,Java對(duì)于eqauls方法和hashCode方法是這樣規(guī)定的:
1、如果兩個(gè)對(duì)象相等易遣,那么它們的hashCode值一定要相等彼妻;
2、如果兩個(gè)對(duì)象的hashCode相等豆茫,它們并不一定相等侨歉。
如何理解hashCode的作用:
以java.lang.Object來(lái)理解,JVM每new一個(gè)Object,它都會(huì)將這個(gè)Object丟到一個(gè)Hash哈希表中去,這樣的話(huà),下次做Object的比較或者取這個(gè)對(duì)象的時(shí)候,它會(huì)根據(jù)對(duì)象的hashcode再?gòu)腍ash表中取這個(gè)對(duì)象。這樣做的目的是提高取對(duì)象的效率揩魂。
具體過(guò)程是這樣:
1.new Object(),JVM根據(jù)這個(gè)對(duì)象的Hashcode值,放入到對(duì)應(yīng)的Hash表對(duì)應(yīng)的Key上,如果不同的對(duì)象確產(chǎn)生了相同的hash值,也就是發(fā)生了Hash key相同導(dǎo)致沖突的情況,那么就在這個(gè)Hash key的地方產(chǎn)生一個(gè)鏈表,將所有產(chǎn)生相同hashcode的對(duì)象放到這個(gè)單鏈表上去,串在一起幽邓。
2.比較兩個(gè)對(duì)象的時(shí)候,首先根據(jù)他們的hashcode去hash表中找他的對(duì)象,當(dāng)兩個(gè)對(duì)象的hashcode相同,那么就是說(shuō)他們這兩個(gè)對(duì)象放在Hash表中的同一個(gè)key上,那么他們一定在這個(gè)key上的鏈表上。那么此時(shí)就只能根據(jù)Object的equal方法來(lái)比較這個(gè)對(duì)象是否equal肤京。當(dāng)兩個(gè)對(duì)象的hashcode不同的話(huà)颊艳,肯定他們不能equal.
改寫(xiě)equals時(shí)總是要改寫(xiě)hashCode茅特。
java.lang.Object中對(duì)hashCode的約定:
- 在一個(gè)應(yīng)用程序執(zhí)行期間忘分,如果一個(gè)對(duì)象的equals方法做比較所用到的信息沒(méi)有被修改的話(huà),則對(duì)該對(duì)象調(diào)用hashCode方法多次白修,它必須始終如一地返回同一個(gè)整數(shù)妒峦。
- 如果兩個(gè)對(duì)象根據(jù)equals(Object o)方法是相等的,則調(diào)用這兩個(gè)對(duì)象中任一對(duì)象的hashCode方法必須產(chǎn)生相同的整數(shù)結(jié)果兵睛。
- 如果兩個(gè)對(duì)象根據(jù)equals(Object o)方法是不相等的肯骇,則調(diào)用這兩個(gè)對(duì)象中任一個(gè)對(duì)象的hashCode方法,不要求產(chǎn)生不同的整數(shù)結(jié)果祖很。但如果能不同笛丙,則可能提高散列表的性能。