前言
hashCode
和equals
常常在面試中會(huì)被問到统屈,在工作中我們也有可能遇到要重寫對(duì)象equals
方法的情況,而且hashCode
方法的設(shè)計(jì)思想值得我們學(xué)習(xí)牙躺,所以我們有必要去深入學(xué)習(xí)一下這兩個(gè)方法愁憔。
下面我就以面試問答的形式學(xué)習(xí)我們的——hashcode
和equals
方法(源碼分析基于JDK8)
問答內(nèi)容
1.
問:hashCode
方法有了解過嗎?這個(gè)方法有什么用孽拷?
答:從JAVA官方對(duì)hashCode
方法的說明定義(定義在示例代碼中)吨掌,我們可以得知hashCode
的作用有如下幾點(diǎn):
hashCode
的存在主要用于查找的快捷性,如Hashtable
乓搬,HashMap
等思犁,hashCode
是用來在散列存儲(chǔ)結(jié)構(gòu)中確定對(duì)象的存儲(chǔ)地址的。如果兩個(gè)對(duì)象相同进肯,就是適用于equals(java.lang.Object) 方法激蹲,那么這兩個(gè)對(duì)象的hashCode一定要相同。
如果對(duì)象的equals方法被重寫江掩,那么對(duì)象的hashCode也盡量重寫学辱,并且產(chǎn)生hashCode使用的對(duì)象乘瓤,一定要和equals方法中使用的一致,否則就會(huì)違反上面提到的第2點(diǎn)策泣。
兩個(gè)對(duì)象的hashCode相同衙傀,并不一定表示兩個(gè)對(duì)象就相同,也就是不一定適用于equals(java.lang.Object) 方法萨咕,只能夠說明這兩個(gè)對(duì)象在散列存儲(chǔ)結(jié)構(gòu)中统抬,如Hashtable,他們“存放在同一個(gè)籃子里”危队。
1.hashcode是用來查找的聪建,如果你學(xué)過數(shù)據(jù)結(jié)構(gòu)就應(yīng)該知道,在查找和排序這一章有
例如內(nèi)存中有這樣的位置
0 1 2 3 4 5 6 7
而我有個(gè)類茫陆,這個(gè)類有個(gè)字段叫ID,我要把這個(gè)類存放在以上8個(gè)位置之一金麸,
如果不用hashcode而任意存放,那么當(dāng)查找時(shí)就需要到這八個(gè)位置里挨個(gè)去找簿盅,或者用二分法一類的算法挥下。
但如果用hashcode那就會(huì)使效率提高很多。
我們這個(gè)類中有個(gè)字段叫ID,那么我們就定義我們的hashcode為ID%8桨醋,
然后把我們的類存放在取得得余數(shù)那個(gè)位置棚瘟。比如我們的ID為9,
9除8的余數(shù)為1讨盒,那么我們就把該類存在1這個(gè)位置解取,
如果ID是13,求得的余數(shù)是5返顺,那么我們就把該類放在5這個(gè)位置。
這樣蔓肯,以后在查找該類時(shí)就可以通過ID除 8求余數(shù)直接找到存放的位置了遂鹊。
2.但是如果兩個(gè)類有相同的hashcode怎么辦那(我們假設(shè)上面的類的ID不是唯一的),
例如9除以8和17除以8的余數(shù)都是1蔗包,那么這是不是合法的秉扑,
回答是:可以這樣。那么如何判斷呢调限?在這個(gè)時(shí)候就需要定義 equals了舟陆。
也就是說,我們先通過 hashcode來判斷兩個(gè)類是否存放某個(gè)桶里耻矮,
但這個(gè)桶里可能有很多類秦躯,那么我們就需要再通過 equals 來在這個(gè)桶里找到我們要的類。
那么裆装。重寫了equals()踱承,為什么還要重寫hashCode()呢倡缠?
想想,你要在一個(gè)桶里找東西茎活,你必須先要找到這個(gè)桶啊昙沦,
你不通過重寫hashcode()來找到桶,光重寫equals()有什么用啊
上述回答轉(zhuǎn)載于:Java中hashCode的作用 由于作者總結(jié)的太好载荔,所以直接轉(zhuǎn)載了
示例代碼:
package java.lang;
public class Object {
·······
/**
* 返回該對(duì)象的哈希碼值盾饮。
* 支持此方法是為了提高哈希表(例如 java.util.Hashtable 提供的哈希表)的性能
* {@link java.util.HashMap}.
* <p>
* hashCode 的常規(guī)協(xié)定是:
* <ul>
* <li>在 Java 應(yīng)用程序執(zhí)行期間,在對(duì)同一對(duì)象多次調(diào)用 hashCode 方法時(shí)懒熙,
* 必須一致地返回相同的整數(shù)丐谋,前提是將對(duì)象進(jìn)行 equals 比較時(shí)所用的信息沒有被修改。
* 從某一應(yīng)用程序的一次執(zhí)行到同一應(yīng)用程序的另一次執(zhí)行煌珊,該整數(shù)無需保持一致号俐。
* <li>如果根據(jù) equals(Object) 方法,兩個(gè)對(duì)象是相等的定庵,
* 那么對(duì)這兩個(gè)對(duì)象中的每個(gè)對(duì)象調(diào)用 hashCode 方法都必須生成相同的整數(shù)結(jié)果吏饿。
* <li>如果根據(jù) equals(java.lang.Object) 方法,兩個(gè)對(duì)象不相等蔬浙,
* 那么對(duì)這兩個(gè)對(duì)象中的任一對(duì)象上調(diào)用 hashCode 方法不 要求一定生成不同的整數(shù)結(jié)果猪落。
* 但是,程序員應(yīng)該意識(shí)到畴博,為不相等的對(duì)象生成不同整數(shù)結(jié)果可以提高哈希表的性能笨忌。
* </ul>
* <p>
* 實(shí)際上,由 Object 類定義的 hashCode 方法確實(shí)會(huì)針對(duì)不同的對(duì)象返回不同的整數(shù)俱病。
* (這一般是通過將該對(duì)象的內(nèi)部地址轉(zhuǎn)換成一個(gè)整數(shù)來實(shí)現(xiàn)的官疲,
* 但是 JavaTM 編程語言不需要這種實(shí)現(xiàn)技巧。)
*
* @return 此對(duì)象的一個(gè)哈希碼值亮隙。
* @see java.lang.Object#equals(java.lang.Object)
* @see java.lang.System#identityHashCode
*/
public native int hashCode();
·······
}
2.
問:談?wù)勀銓?duì)equals(Object obj)
方法的理解途凫,它和 ==
操作符相比,有什么區(qū)別溢吻?
答:
A.==
操作符分為兩種情況:
比較基礎(chǔ)類型(byte,short,int,long,float,double,char,boolean)時(shí)维费,比較的是值是否相等
比較對(duì)象,比較的是對(duì)象在內(nèi)存中的空間地址是否相等促王。
B.equals(Object obj)
方法比較也分為兩種情況:
如果一個(gè)類沒有重寫
equals(Object obj)
方法犀盟,則等價(jià)于通過==
比較兩個(gè)對(duì)象,即比較的是對(duì)象在內(nèi)存中的空間地址是否相等蝇狼。如果重寫了
equals(Object obj)
方法阅畴,則根據(jù)重寫的方法內(nèi)容去比較相等,返回true
則相等题翰,false
則不相等恶阴。
3.
問:那如果要您去重寫equals(Object obj)
方法诈胜,您會(huì)怎么做?重寫的過程需要注意什么冯事?
答:我們?cè)谥貙?code>equals(Object obj)方法焦匈,需要遵守JAVA官方的通用約定(詳細(xì)請(qǐng)看示例代碼),約定簡(jiǎn)述:
自反性:對(duì)于非 null 的對(duì)象 x昵仅,必須有 x.equals(x)=true缓熟;
對(duì)稱性:如果 x.equals(y)=true,那么 y.equals(x) 必須也為true摔笤;
傳遞性:如果 x.equals(y)=true 而且 y.equals(z)=true够滑,那么x.equals(z) 必須為true;
對(duì)于非 null 的對(duì)象 x吕世,一定有x.equals(null)=false
當(dāng)
equals(Object obj)
方法被重寫時(shí)彰触,通常有必要重寫 hashCode 方法,以維護(hù) hashCode 方法的常規(guī)協(xié)定命辖,該協(xié)定聲明相等對(duì)象必須具有相等的哈希碼况毅。
根據(jù)上述約定,我們可以按如下步驟重寫equals(Object obj)
:
1). 先使用 ==
操作符判斷兩個(gè)對(duì)象的引用地址是否相同尔艇。
2). 使用instanceof
來判斷 兩個(gè)對(duì)象的類型是否一致尔许。
3). 如果類型相同,則把待比較參數(shù)轉(zhuǎn)型终娃,逐一比較兩個(gè)對(duì)象內(nèi)部的值是否一致味廊,全部一致才返回true
,否則返回false
。
4). 重寫hashCode
方法棠耕,確保相等的兩個(gè)對(duì)象必須具有相等的哈希碼余佛。
- 我們?cè)谥貙懸粋€(gè)類的
hashCode
方法時(shí),最好是將所有用于相等性檢查的字段都進(jìn)行hashCode
計(jì)算昧辽,最后將所有hashCode
值相加衙熔,得出最終的hashCode
,這樣可以保證hashCode生成均勻搅荞,不容易產(chǎn)生碰撞。
常見數(shù)據(jù)類型hashcode計(jì)算方式如下(參考自JDK源碼):
重要字段var的類型 | hash運(yùn)算 |
---|---|
byte,short,int,char | (int)var |
long | (int)(var ^ (var >>> 32)) |
float | Float.floatToIntBits(var) |
double | long bits = Double.doubleToLongBits(var);分量 = (int)(bits ^ (bits >>> 32)); |
引用類型 | (null == var ? 0 : var.hashCode()) |
示例代碼:
/**
* 指示其他某個(gè)對(duì)象是否與此對(duì)象“相等”框咙。
* <p>
* equals 方法在非空對(duì)象引用上實(shí)現(xiàn)相等關(guān)系:
* <ul>
* <li>自反性:對(duì)于任何非空引用值 x咕痛,x.equals(x) 都應(yīng)返回 true。
*
* <li>對(duì)稱性:對(duì)于任何非空引用值 x 和 y喇嘱,當(dāng)且僅當(dāng) y.equals(x) 返回 true 時(shí)茉贡,
* x.equals(y) 才應(yīng)返回 true。
*
* <li>傳遞性:對(duì)于任何非空引用值 x者铜、y 和 z腔丧,如果 x.equals(y) 返回 true放椰,
* 并且 y.equals(z) 返回 true,那么 x.equals(z) 應(yīng)返回 true愉粤。
*
* <li>一致性:對(duì)于任何非空引用值 x 和 y砾医,多次調(diào)用 x.equals(y) 始終返回
* true 或始終返回 false,前提是對(duì)象上 equals 比較中所用的信息沒有被修改衣厘。
*
* <li>對(duì)于任何非空引用值 x如蚜,x.equals(null) 都應(yīng)返回 false。
* </ul>
*
* <p>
* Object 類的 equals 方法實(shí)現(xiàn)對(duì)象上差別可能性最大的相等關(guān)系影暴;
* 即错邦,對(duì)于任何非空引用值 x 和 y,當(dāng)且僅當(dāng) x 和 y 引用同一個(gè)對(duì)象時(shí)型宙,
* 此方法才返回 true(x == y 具有值 true)撬呢。
*
* <p>
* 注意:當(dāng)此方法被重寫時(shí),通常有必要重寫 hashCode 方法妆兑,
* 以維護(hù) hashCode 方法的常規(guī)協(xié)定魂拦,該協(xié)定聲明相等對(duì)象必須具有相等的哈希碼。
*
* @param 要與之比較的引用對(duì)象箭跳。
* @return 如果此對(duì)象與 obj 參數(shù)相同晨另,則返回 true;否則返回 false谱姓。
* @see #hashCode()
* @see java.util.HashMap
*/
public boolean equals(Object obj) {
return (this == obj);
}
4.
問:如果需要您去維護(hù)一個(gè)類的hash散列表借尿,如何設(shè)計(jì),如何解決hash沖突屉来?
答:我們?cè)谠O(shè)計(jì)類的hash散列表時(shí)路翻,不能保證每個(gè)元素的hash值都是不一樣的,這樣就會(huì)造成hash沖突茄靠。解決hash沖突有如下4種方法:
開發(fā)定址法:既然當(dāng)前位置容不下沖突的元素了茂契,那就再找一個(gè)空的位置存儲(chǔ) Hash 沖突的值(當(dāng)前 index 沖突了,那么將沖突的元素放在 index+1)慨绳。
再散列法:換一個(gè) Hash 算法再計(jì)算一個(gè) hash 值掉冶,如果不沖突了就存儲(chǔ)值(例如第一個(gè)算法是名字的首字母的 Hash 值,如果沖突了脐雪,計(jì)算名字的第二個(gè)字母的 Hash 值厌小,如果沖突解決了則將值放入數(shù)組中)。
鏈地址法:每個(gè)數(shù)組中都存有一個(gè)單鏈表战秋,發(fā)生 Hash 沖突時(shí)璧亚,只是將沖突的 value 當(dāng)作新節(jié)點(diǎn)插入到鏈表(HashMap 解決沖突的辦法)。
公共溢出區(qū)法:將沖突的 value 都存到另外一個(gè)順序表中脂信,查找時(shí)如果當(dāng)前表沒有對(duì)應(yīng)值癣蟋,則去溢出區(qū)進(jìn)行順序查找透硝。
總結(jié)
- 當(dāng)你真要的需要重寫
equals
方法,這兩點(diǎn)一定要記追杞痢:
A.如果兩個(gè)對(duì)象相等(equals() 返回 true)濒生,那么它們的 hashCode()一定要相同;
B.如果兩個(gè)對(duì)象hashCode()相等秉撇,它們并不一定相等(equals() 不一定返回 true)甜攀。
如果重寫的
equals
方法但不重寫hashCode
,都是耍流氓琐馆,會(huì)有意想不到的結(jié)果规阀。重寫
hashCode
方法時(shí),盡可能將所有用于相等比較的參數(shù)都參與hashCode的計(jì)算瘦麸。建立hash散列表的意義就是在于谁撼,提高查詢效率,當(dāng)數(shù)據(jù)量大時(shí)滋饲,尤為顯著厉碟。
參考文章:
Java中hashCode的作用
如何正確實(shí)現(xiàn) Java 中的 HashCode
Java 的 equals 與 hashcode 對(duì)比分析
程序員必須搞清的概念equals和=和hashcode的區(qū)別
Android 面試準(zhǔn)備之「equals 和 == 」