編輯距離求解算法分析

編輯距離是一種衡量兩個相似字符串相似性的度量方法弟头。距離越大相似度越小吩抓。具體地,兩個字符串的編輯距離是其中一個字符串要變換為另一個字符串所需要的最小編輯次數(shù)赴恨。其中編輯操作包含3種:增加一個字符疹娶,刪除一個字符,更改一個字符伦连。

使用編輯距離可以用來進行用戶輸入糾錯雨饺。比如sql語句有select insert update insert等合法命令,若用戶輸入selet惑淳,則可以計算selet與合法命令的編輯距離额港,找到距離最近的命令(select)提示用戶進行更正。當然歧焦,編輯距離不止于此移斩。

計算編輯距離的源碼如下

    public static int editDist(String a, String b, int i, int j) {
        if (i == -1 || j == -1) {
            return Math.max(i+1, j+1);
        }
        ArrayList<Integer> list = new ArrayList<>();
        list.add(editDist(a, b, i - 1, j) + 1);
        list.add(editDist(a, b, i, j - 1) + 1);
        list.add(editDist(a, b, i - 1, j - 1) + (a.charAt(i) == b.charAt(j) ? 0 : 1));
        return Collections.min(list);
    }

計算編輯距離的程序雖然簡短,但并不簡單绢馍。其并不是企圖將其中一個字符串通過編輯變?yōu)榱硗庖粋€向瓷,而是利用了編輯距離的如下性質(zhì):

假設(shè)字符串s1,s2經(jīng)過編輯操作變換后變?yōu)閠1舰涌,t2猖任。則若s1,s2都應(yīng)用了相同的編輯操作瓷耙,則s1與s2的編輯距離應(yīng)該等于t1與t2的編輯距離朱躺,否則s1,s2的編輯距離為t1與t2編輯距離加上不同的編輯操作次數(shù)哺徊。

利用如上性質(zhì)室琢,我們可以設(shè)計一些操作將兩個字符串s1,s2經(jīng)過最小次編輯后都變?yōu)榭沾渥贰S捎趖1盈滴,t2變?yōu)榭眨庉嬀嚯x為0,則最小的不同編輯次數(shù)就是所求的編輯距離巢钓。

于是算法設(shè)計了三種編輯操作病苗,目的是將兩個字符串分別約簡為空串。涉及的操作有兩種

  1. 刪除第一個字符串的末尾字符
  2. 刪除第二個字符串的末尾字符
  3. 同時刪除兩個字符串的末尾字符

很顯然操作1,2會增加原始字符串的編輯距離症汹,而操作3若刪除的字符相同則不增加編輯距離硫朦,否則也增加編輯距離。

經(jīng)過如上定義背镇,求編輯距離的問題就轉(zhuǎn)化為如何用最小的編輯距離距離增量將兩個字符串都約簡為空串咬展。

算法用動態(tài)規(guī)劃來解決這個轉(zhuǎn)化后的問題,故而得到如上算法瞒斩。

通過編輯距離分析編輯距離的求解方法破婆,我們可以得到啟示,有時候可以利用定義本身的性質(zhì)來將原問題轉(zhuǎn)化為更易解決的問題胸囱,再去變成實現(xiàn)祷舀。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市烹笔,隨后出現(xiàn)的幾起案子裳扯,更是在濱河造成了極大的恐慌,老刑警劉巖谤职,帶你破解...
    沈念sama閱讀 207,113評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件饰豺,死亡現(xiàn)場離奇詭異,居然都是意外死亡允蜈,警方通過查閱死者的電腦和手機哟忍,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,644評論 2 381
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來陷寝,“玉大人锅很,你說我怎么就攤上這事》锱埽” “怎么了爆安?”我有些...
    開封第一講書人閱讀 153,340評論 0 344
  • 文/不壞的土叔 我叫張陵,是天一觀的道長仔引。 經(jīng)常有香客問我扔仓,道長,這世上最難降的妖魔是什么咖耘? 我笑而不...
    開封第一講書人閱讀 55,449評論 1 279
  • 正文 為了忘掉前任翘簇,我火速辦了婚禮,結(jié)果婚禮上儿倒,老公的妹妹穿的比我還像新娘版保。我一直安慰自己呜笑,他們只是感情好,可當我...
    茶點故事閱讀 64,445評論 5 374
  • 文/花漫 我一把揭開白布彻犁。 她就那樣靜靜地躺著叫胁,像睡著了一般。 火紅的嫁衣襯著肌膚如雪汞幢。 梳的紋絲不亂的頭發(fā)上驼鹅,一...
    開封第一講書人閱讀 49,166評論 1 284
  • 那天,我揣著相機與錄音森篷,去河邊找鬼输钩。 笑死,一個胖子當著我的面吹牛仲智,可吹牛的內(nèi)容都是我干的张足。 我是一名探鬼主播,決...
    沈念sama閱讀 38,442評論 3 401
  • 文/蒼蘭香墨 我猛地睜開眼坎藐,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了哼绑?” 一聲冷哼從身側(cè)響起岩馍,我...
    開封第一講書人閱讀 37,105評論 0 261
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎抖韩,沒想到半個月后蛀恩,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,601評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡茂浮,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,066評論 2 325
  • 正文 我和宋清朗相戀三年双谆,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片席揽。...
    茶點故事閱讀 38,161評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡顽馋,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出幌羞,到底是詐尸還是另有隱情寸谜,我是刑警寧澤,帶...
    沈念sama閱讀 33,792評論 4 323
  • 正文 年R本政府宣布属桦,位于F島的核電站熊痴,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏聂宾。R本人自食惡果不足惜果善,卻給世界環(huán)境...
    茶點故事閱讀 39,351評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望系谐。 院中可真熱鬧巾陕,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,352評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至馆类,卻和暖如春混聊,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背乾巧。 一陣腳步聲響...
    開封第一講書人閱讀 31,584評論 1 261
  • 我被黑心中介騙來泰國打工句喜, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人沟于。 一個月前我還...
    沈念sama閱讀 45,618評論 2 355
  • 正文 我出身青樓咳胃,卻偏偏與公主長得像,于是被迫代替她去往敵國和親旷太。 傳聞我的和親對象是個殘疾皇子展懈,可洞房花燭夜當晚...
    茶點故事閱讀 42,916評論 2 344

推薦閱讀更多精彩內(nèi)容

  • 9.3.3 快速排序 ??快速排序?qū)⒃瓟?shù)組劃分為兩個子數(shù)組,第一個子數(shù)組中元素小于等于某個邊界值供璧,第二個子數(shù)組中的...
    RichardJieChen閱讀 1,833評論 0 3
  • java筆記第一天 == 和 equals ==比較的比較的是兩個變量的值是否相等存崖,對于引用型變量表示的是兩個變量...
    jmychou閱讀 1,485評論 0 3
  • 1. Java基礎(chǔ)部分 基礎(chǔ)部分的順序:基本語法,類相關(guān)的語法睡毒,內(nèi)部類的語法来惧,繼承相關(guān)的語法,異常的語法演顾,線程的語...
    子非魚_t_閱讀 31,587評論 18 399
  • 背景 一年多以前我在知乎上答了有關(guān)LeetCode的問題, 分享了一些自己做題目的經(jīng)驗供搀。 張土汪:刷leetcod...
    土汪閱讀 12,724評論 0 33
  • 《趟過你的愛情河》 文/白傳英 眼里是你過去的歲月 時光在日歷上走過 現(xiàn)在你是否還能想起我 和你趟過的那...
    白清風(fēng)閱讀 162評論 0 0