編輯距離

/**
 * 給出字符串:str1渴肉、str2忽匈;判斷這兩個(gè)字符串的相似度有多大;
 * 編輯距離:可通過增刪改,將str1操作某一或某幾個(gè)字符轉(zhuǎn)換成str2,其中改變最小的距離,為最優(yōu)。
 * Dp規(guī)劃實(shí)現(xiàn)編輯距離的相似度測算
 * 空間復(fù)雜度:O(mn)
 * 時(shí)間復(fù)雜度:O(mn)
 * @author Administrator
 */
public class EditDistanceUtils {

    /**
     * Dp規(guī)劃實(shí)現(xiàn)的編輯距離
     * 步驟:
     * 1、構(gòu)建一個(gè)二維數(shù)組嘁信;
     * 2于样、初始化input、target中每個(gè)字符的索引位置潘靖,分別初始化值的位置是第一行與第一列穿剖,表示input與target;
     * 3卦溢、根據(jù)判斷糊余,算出對應(yīng)二維數(shù)組坐標(biāo)處對應(yīng)的編輯距離;(這里的距離单寂,就是距離目標(biāo)的字符的索引數(shù)值差)
     * 4贬芥、最后的對角值即為最終編輯距離的結(jié)果
     * **/
    private static int getEditDistance(String input, String target){
        try {
            int m = input.length();
            int n = target.length();
            if(m <= 0){
                return n;
            }
            if(n <= 0){
                return m;
            }
            //構(gòu)建二維數(shù)組,并初始化
            int[][] matrix = new int[m][n];
            for(int i = 0; i < m; ++i){
                matrix[i][0] = i;
            }
            for(int i = 0; i < n; ++i){
                matrix[0][i] = i;
            }
            //遍歷整個(gè)二維數(shù)組宣决,獲取每個(gè)字符所在位置的編輯距離蘸劈;因?yàn)橐?jì)算i-1、j-1的位置尊沸,故從i/j=1開始
            for(int i = 1; i < m; ++i){
                for(int j = 1; j < n; ++j){
                    int c = input.charAt(i) == target.charAt(j) ? 0 : 1;
                    //i-1威沫、j-1是算上一個(gè)交叉點(diǎn)的位置坐標(biāo);i-1洼专、j與i棒掠、j-1為相鄰兩側(cè),從索引處已經(jīng)減1屁商,故加1
                    matrix[i][j] = Math.min(matrix[i-1][j-1] + c, Math.min(matrix[i -1][j] + 1, matrix[i][j - 1] + 1));
                }
            }

            return matrix[m - 1][n - 1];
        }catch (Exception e){
            e.printStackTrace();
        }
        return 0;
    }

    /**
     * 計(jì)算兩個(gè)字符串的 相似度
     * **/
    public static Double getSimilarity(String input, String target){
        Integer distance = getEditDistance(input, target);

        Double similarity = 1 -  distance.doubleValue() / Math.max(input.length(), target.length());
        return similarity;
    }

    /**
     * 計(jì)算輸入字符串烟很,與其他多個(gè)字符串的相似度
     * **/
    public static Map<String, Double> getSimilarityMap(String input, String... targets){
        try{
            if(input.length() <= 0){
                return Collections.EMPTY_MAP;
            }
            if(targets == null || targets.length <= 0){
                return Collections.EMPTY_MAP;
            }
            LinkedHashMap<String,Double> linkedHashMap = new LinkedHashMap<>();
            String target = "";
            for(int i = 0; i < targets.length; ++i){
                target = targets[i];
                Double similarity = getSimilarity(input, target);
                linkedHashMap.put(target, similarity);
            }
            return linkedHashMap;
        }catch (Exception e){
            e.printStackTrace();
        }
        return Collections.EMPTY_MAP;
    }

    /**
     * 計(jì)算輸入字符串,與其他多個(gè)字符串的相似度
     * **/
    public static Map<String, Double> getSimilarityMap(String input, Double limit, String... targets){
        try{
            Map<String, Double> linkedHashMap = getSimilarityMap(input, targets);
            List<String> keyList =  linkedHashMap.keySet().stream().collect(Collectors.toList());
            LinkedHashMap<String, Double> limitMap = new LinkedHashMap<>();
            String key = "";
            Double value = 0D;
            for(int i = 0; i < keyList.size(); ++i){
                key = keyList.get(i);
                value = linkedHashMap.getOrDefault(key, 0D);
                if(value >= limit){
                    limitMap.put(key, value);
                }
            }
            return limitMap;
        }catch (Exception e){
            e.printStackTrace();
        }
        return Collections.EMPTY_MAP;
    }

    public static void main(String[] args) {

        getSimilarityMap("haizeiwang", 0.8D,"haizhughaiwang","haizaiwang","haizaiwatg");
    }

}
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末棒假,一起剝皮案震驚了整個(gè)濱河市溯职,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌帽哑,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,544評(píng)論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件叹俏,死亡現(xiàn)場離奇詭異妻枕,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)粘驰,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,430評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門屡谐,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人蝌数,你說我怎么就攤上這事愕掏。” “怎么了顶伞?”我有些...
    開封第一講書人閱讀 162,764評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵饵撑,是天一觀的道長剑梳。 經(jīng)常有香客問我,道長滑潘,這世上最難降的妖魔是什么垢乙? 我笑而不...
    開封第一講書人閱讀 58,193評(píng)論 1 292
  • 正文 為了忘掉前任,我火速辦了婚禮语卤,結(jié)果婚禮上追逮,老公的妹妹穿的比我還像新娘。我一直安慰自己粹舵,他們只是感情好钮孵,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,216評(píng)論 6 388
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著眼滤,像睡著了一般油猫。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上柠偶,一...
    開封第一講書人閱讀 51,182評(píng)論 1 299
  • 那天情妖,我揣著相機(jī)與錄音,去河邊找鬼诱担。 笑死毡证,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的蔫仙。 我是一名探鬼主播料睛,決...
    沈念sama閱讀 40,063評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼摇邦!你這毒婦竟也來了恤煞?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,917評(píng)論 0 274
  • 序言:老撾萬榮一對情侶失蹤施籍,失蹤者是張志新(化名)和其女友劉穎居扒,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體丑慎,經(jīng)...
    沈念sama閱讀 45,329評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡喜喂,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,543評(píng)論 2 332
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了竿裂。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片玉吁。...
    茶點(diǎn)故事閱讀 39,722評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖腻异,靈堂內(nèi)的尸體忽然破棺而出进副,到底是詐尸還是另有隱情,我是刑警寧澤悔常,帶...
    沈念sama閱讀 35,425評(píng)論 5 343
  • 正文 年R本政府宣布影斑,位于F島的核電站给赞,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏鸥昏。R本人自食惡果不足惜塞俱,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,019評(píng)論 3 326
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望吏垮。 院中可真熱鬧障涯,春花似錦、人聲如沸膳汪。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,671評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽遗嗽。三九已至粘我,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間痹换,已是汗流浹背征字。 一陣腳步聲響...
    開封第一講書人閱讀 32,825評(píng)論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留娇豫,地道東北人匙姜。 一個(gè)月前我還...
    沈念sama閱讀 47,729評(píng)論 2 368
  • 正文 我出身青樓,卻偏偏與公主長得像冯痢,于是被迫代替她去往敵國和親氮昧。 傳聞我的和親對象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,614評(píng)論 2 353