equals方法和hashCode方法均是Object對象的方法。Object中關(guān)于hashCode約定的規(guī)范如下:
- 在應(yīng)用程序的執(zhí)行期間,只要對象的equals方法的比較操作所用到的信息沒有被修改苇羡,那么對同一個對象調(diào)用多次,hashCode方法都必須始終如一地返回同一個整數(shù)婿牍。在同一個應(yīng)用程序的多次執(zhí)行過程中哥牍,每次執(zhí)行所返回的整數(shù)可以不一致。
2.如果兩個對象根據(jù)equals(Object)方法比較是相等的环鲤,那么調(diào)用這兩個對象中任意一個對象的hashCode方法都必須產(chǎn)生同樣的整數(shù)結(jié)果纯趋。
3.如果兩個對象根據(jù)equals(Object)方法比較是不相等的,那么調(diào)用這兩個對象中任意一個對象的hashCode方法冷离,則不一定要產(chǎn)生不同的整數(shù)結(jié)果吵冒。但是程序員應(yīng)該知道,給不相等的對象產(chǎn)生截然不同的整數(shù)結(jié)果西剥,有可能提高散列表(hash table)的性能痹栖。
如果某個類違反Object的hashCode的通用約定,會導(dǎo)致該類無法結(jié)合所有基于散列的集合一起正常運轉(zhuǎn)瞭空,如:HashMap揪阿、HashSet和HashTable。
覆蓋equals方法而沒有覆蓋hashCode方法違反了約定的第2條:相等的對象必須具有相等的散列碼咆畏。
如下示例:
package com.wuyafu.java.effective.hashcode;
import java.util.HashMap;
import java.util.Map;
public class PhoneNumber {
private final short areaCode;
private final short prefix;
private final short lineNumber;
public PhoneNumber(int areaCode, int prefix, int lineNumber) {
rangeCheck(areaCode, 999, "area code");
rangeCheck(prefix, 999, "prefix");
rangeCheck(lineNumber, 9999, "lineNumber");
this.areaCode = (short)areaCode;
this.prefix = (short)prefix;
this.lineNumber = (short)lineNumber;
}
private static void rangeCheck(int arg, int max, String name){
if (arg < 0|| arg > max) {
throw new IllegalArgumentException(name + ":" + arg);
}
}
@Override
public boolean equals(Object o){
if (o == this)
return true;
if (!(o instanceof PhoneNumber))
return false;
PhoneNumber pn = (PhoneNumber)o;
return pn.lineNumber == lineNumber
&& pn.prefix == prefix
&& pn.areaCode == areaCode;
}
/**
* @param args
*/
public static void main(String[] args) {
// TODO Auto-generated method stub
Map<PhoneNumber, String> m =
new HashMap<PhoneNumber, String>();
m.put(new PhoneNumber(408, 867, 5309), "Jenny");
System.out.println(m.get(new PhoneNumber(408, 867, 5309)));
}
}
由于PhoneNumber類沒有覆蓋hashCode方法南捂,從而導(dǎo)致兩個相等的實例具有不相等的散列碼,違反了hashCode的約定旧找。
為解決這個問題溺健,只需為PhoneNumber類提供一個適當?shù)膆ashCode方法即可。
如下:
@Override
public int hashCode(){return 42;}
該方法確保了相等的對象總是具有同樣的散列碼钦讳。但是它也極為惡劣矿瘦,因為它使得每個對象都具有同樣的散列碼枕面。因此每個對象都被映射到同一個散列桶中,使散列表退化為鏈表缚去。
一個好的散列函數(shù)通常傾向于“為不相等的對象產(chǎn)生不相等的散列碼”潮秘,散列函數(shù)應(yīng)該把集合中不相等的實例均勻地分布到所有可能的散列值上。實現(xiàn)這種理想狀態(tài)很難易结,但如下方法可以接近理想狀態(tài):
在散列碼的計算過程中枕荞,可以把冗余域排除在外。
在公式中result不能為0,17為任意選的值搞动。
31為奇素數(shù)躏精,有更好的性能
利用上述接近辦法,修改PhoneNumber類的hashCode方法如下:
@Override
public int hashCode(){
int result = 17;
result = 31 * result + areaCode;
result = 31 * result + prefix;
result = 31 * result + lineNumber;
return result;
}
如果一個類是不可變的鹦肿,并且計算散列碼的開銷也比較大矗烛,就應(yīng)該考慮把散列碼緩存在對象內(nèi)部,而不是每次請求的時候都重新計算散列碼箩溃〔t吃?梢酝ㄟ^“延遲初始化”散列碼的方式來實現(xiàn),修改PhoneNumber類的hashCode方法如下:
private volatile int hashCode;
@Override
public int hashCode(){
int result = hashCode;
if (result == 0) {
result = 17;
result = 31* result + areaCode;
result = 31* result + prefix;
result = 31* result + lineNumber;
}
}
總結(jié):當覆蓋equals方法時涣旨,要覆蓋hashCode方法歪架,并且采用公式來將對象的關(guān)鍵域參與到散列碼的計算中,確保不相同的對象在不同的散列桶中霹陡。若該類是不可變的和蚪,可以考慮使用“延遲初始化”散列碼的方式。