/**
* 給出字符串:str1渴肉、str2忽匈;判斷這兩個(gè)字符串的相似度有多大;
* 編輯距離:可通過增刪改,將str1操作某一或某幾個(gè)字符轉(zhuǎn)換成str2,其中改變最小的距離,為最優(yōu)。
* Dp規(guī)劃實(shí)現(xiàn)編輯距離的相似度測算
* 空間復(fù)雜度:O(mn)
* 時(shí)間復(fù)雜度:O(mn)
* @author Administrator
*/
public class EditDistanceUtils {
/**
* Dp規(guī)劃實(shí)現(xiàn)的編輯距離
* 步驟:
* 1、構(gòu)建一個(gè)二維數(shù)組嘁信;
* 2于样、初始化input、target中每個(gè)字符的索引位置潘靖,分別初始化值的位置是第一行與第一列穿剖,表示input與target;
* 3卦溢、根據(jù)判斷糊余,算出對應(yīng)二維數(shù)組坐標(biāo)處對應(yīng)的編輯距離;(這里的距離单寂,就是距離目標(biāo)的字符的索引數(shù)值差)
* 4贬芥、最后的對角值即為最終編輯距離的結(jié)果
* **/
private static int getEditDistance(String input, String target){
try {
int m = input.length();
int n = target.length();
if(m <= 0){
return n;
}
if(n <= 0){
return m;
}
//構(gòu)建二維數(shù)組,并初始化
int[][] matrix = new int[m][n];
for(int i = 0; i < m; ++i){
matrix[i][0] = i;
}
for(int i = 0; i < n; ++i){
matrix[0][i] = i;
}
//遍歷整個(gè)二維數(shù)組宣决,獲取每個(gè)字符所在位置的編輯距離蘸劈;因?yàn)橐?jì)算i-1、j-1的位置尊沸,故從i/j=1開始
for(int i = 1; i < m; ++i){
for(int j = 1; j < n; ++j){
int c = input.charAt(i) == target.charAt(j) ? 0 : 1;
//i-1威沫、j-1是算上一個(gè)交叉點(diǎn)的位置坐標(biāo);i-1洼专、j與i棒掠、j-1為相鄰兩側(cè),從索引處已經(jīng)減1屁商,故加1
matrix[i][j] = Math.min(matrix[i-1][j-1] + c, Math.min(matrix[i -1][j] + 1, matrix[i][j - 1] + 1));
}
}
return matrix[m - 1][n - 1];
}catch (Exception e){
e.printStackTrace();
}
return 0;
}
/**
* 計(jì)算兩個(gè)字符串的 相似度
* **/
public static Double getSimilarity(String input, String target){
Integer distance = getEditDistance(input, target);
Double similarity = 1 - distance.doubleValue() / Math.max(input.length(), target.length());
return similarity;
}
/**
* 計(jì)算輸入字符串烟很,與其他多個(gè)字符串的相似度
* **/
public static Map<String, Double> getSimilarityMap(String input, String... targets){
try{
if(input.length() <= 0){
return Collections.EMPTY_MAP;
}
if(targets == null || targets.length <= 0){
return Collections.EMPTY_MAP;
}
LinkedHashMap<String,Double> linkedHashMap = new LinkedHashMap<>();
String target = "";
for(int i = 0; i < targets.length; ++i){
target = targets[i];
Double similarity = getSimilarity(input, target);
linkedHashMap.put(target, similarity);
}
return linkedHashMap;
}catch (Exception e){
e.printStackTrace();
}
return Collections.EMPTY_MAP;
}
/**
* 計(jì)算輸入字符串,與其他多個(gè)字符串的相似度
* **/
public static Map<String, Double> getSimilarityMap(String input, Double limit, String... targets){
try{
Map<String, Double> linkedHashMap = getSimilarityMap(input, targets);
List<String> keyList = linkedHashMap.keySet().stream().collect(Collectors.toList());
LinkedHashMap<String, Double> limitMap = new LinkedHashMap<>();
String key = "";
Double value = 0D;
for(int i = 0; i < keyList.size(); ++i){
key = keyList.get(i);
value = linkedHashMap.getOrDefault(key, 0D);
if(value >= limit){
limitMap.put(key, value);
}
}
return limitMap;
}catch (Exception e){
e.printStackTrace();
}
return Collections.EMPTY_MAP;
}
public static void main(String[] args) {
getSimilarityMap("haizeiwang", 0.8D,"haizhughaiwang","haizaiwang","haizaiwatg");
}
}
編輯距離
最后編輯于 :
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
- 文/潘曉璐 我一進(jìn)店門屡谐,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人蝌数,你說我怎么就攤上這事愕掏。” “怎么了顶伞?”我有些...
- 文/不壞的土叔 我叫張陵饵撑,是天一觀的道長剑梳。 經(jīng)常有香客問我,道長滑潘,這世上最難降的妖魔是什么垢乙? 我笑而不...
- 正文 為了忘掉前任,我火速辦了婚禮语卤,結(jié)果婚禮上追逮,老公的妹妹穿的比我還像新娘。我一直安慰自己粹舵,他們只是感情好钮孵,可當(dāng)我...
- 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著眼滤,像睡著了一般油猫。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上柠偶,一...
- 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼摇邦!你這毒婦竟也來了恤煞?” 一聲冷哼從身側(cè)響起,我...
- 序言:老撾萬榮一對情侶失蹤施籍,失蹤者是張志新(化名)和其女友劉穎居扒,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體丑慎,經(jīng)...
- 正文 獨(dú)居荒郊野嶺守林人離奇死亡喜喂,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
- 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了竿裂。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片玉吁。...
- 正文 年R本政府宣布影斑,位于F島的核電站给赞,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏鸥昏。R本人自食惡果不足惜塞俱,卻給世界環(huán)境...
- 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望吏垮。 院中可真熱鬧障涯,春花似錦、人聲如沸膳汪。這莊子的主人今日做“春日...
- 文/蒼蘭香墨 我抬頭看了看天上的太陽遗嗽。三九已至粘我,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間痹换,已是汗流浹背征字。 一陣腳步聲響...
- 正文 我出身青樓,卻偏偏與公主長得像冯痢,于是被迫代替她去往敵國和親氮昧。 傳聞我的和親對象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...