最長公共子序列問題

問題描述:

求兩個字符序列的公共最長子序列。


最長公共子串

在回到子序列問題之前钮糖,先來了解一下子串的問題梅掠。
例如,HISH和FISH兩個字符序列的公共最長子串就是:ISH店归。很容易理解阎抒。


繪制網(wǎng)格

通過上一次背包問題的學(xué)習(xí),給了我一些很重要的啟示:

  • 每種動態(tài)規(guī)劃解決方案都設(shè)計網(wǎng)格消痛。
  • 動態(tài)規(guī)劃可以幫助你在給定約束條件下找到最優(yōu)解且叁。
  • 問題可分解為彼此獨立且離散的子問題時,就可以使用動態(tài)規(guī)劃法來解決秩伞。

那么逞带,要解決這個問題的網(wǎng)格長什么樣呢?要確定這一點纱新,你首先得回答:

  • 1.單元格中的值是什么展氓?
  • 2.如何將這個問題劃分成子問題?
  • 3.網(wǎng)格的坐標(biāo)軸是什么脸爱?

在動態(tài)規(guī)劃中遇汞,你要將某個指標(biāo)最大化。在這個例子中,你要找出兩個單詞的最長公共子序列空入。hish和fish都包含的最長子序列是什么教寂?hish和vista呢?這就是你要計算的值执庐。

別忘了酪耕,單元格中的值通常就是你要優(yōu)化的值。在這個例子中轨淌,這很可能是一個數(shù)字:兩個字符串都包含的最長子串的長度迂烁。

如何把這個問題劃分成子問題呢?你可能需要比較字符串:不是比較hish和fish递鹉,而是先比較his和fis盟步。每個單元格都將包含著兩個字符串的最長公共字符串的長度□锝幔或許有了一些線索:


填充網(wǎng)格

現(xiàn)在却盘,你很清楚網(wǎng)格應(yīng)是怎么樣的。填充該網(wǎng)格的每個單元格時媳拴,該使用什么樣的公式呢黄橘?由于你已經(jīng)知道了答案——hish和fish的最長子序列為ish,所以可以作點弊屈溉。

幾遍如此塞关,你還是不能確定該使用什么樣的公式。計算機科學(xué)家有時會開玩笑說子巾,那就使用費曼算法(Feynman algorithm)帆赢。這個算法是以注明物理學(xué)家理查德·費曼命名的,其步驟如下:

實際上线梗,根本沒有找出計算公式的簡單辦法椰于,你必須通過嘗試才能找出管用的公式。有些算法并非精確的解決步驟仪搔,而只是幫助你理清思路的框架瘾婿。


最終的網(wǎng)格

可以從其中總結(jié)出以下的規(guī)律:

實現(xiàn)這個公式的偽代碼大概長這樣:

if (chars1[i - 1] == chars2[j - 1]) {
    array[i][j] = array[i - 1][j - 1] + 1;
} else {
    array[i][j] = 0
}

需要注意的一點是,這個問題的最終答案并不一定在最后一個單元格中僻造!對于前面的背包問題憋他,最終答案總是在最后的單元格中。單對于LCS問題來說髓削,答案為網(wǎng)格中最大的數(shù)字——它可能并不位于最后的單元格中竹挡。例如單詞hish和vista的最長公共子串時,網(wǎng)格如下:


最長公共子序列

假設(shè)Alex不小心輸入了fosh立膛,那么它原本是想輸入fish還是fort呢揪罕?我們使用最長子序列來比較它們梯码。

最長公共個子串的長度相同,都包含兩個字母好啰。但fosh與fish更像轩娶。

這里比較的是最長公共子串,但其實應(yīng)該比較最長子序列:兩個單詞中都有的序列包含的字數(shù)框往。如何計算最長公共子序列呢鳄抒?

下面是用于計算fish和fosh的最長公共子序列的網(wǎng)格:

下面是填寫這個網(wǎng)格的公式:

偽代碼大概長這樣:

if (chars1[i - 1] == chars2[j - 1]) {
    array[i][j] = array[i - 1][j - 1] + 1;
} else {
    array[i][j] = max{array[i -1][j] , array[i][j - 1] };
}

代碼實現(xiàn):

整個程序是從自己的算法學(xué)習(xí)程序中直接扒下來的,inputList保存的是從文本文件中一行一行讀取到的數(shù)值椰弊,outputList保存的是要輸出到文本文件中的數(shù)據(jù)许溅。由于要輸出,所以定義了一個boolean類型的isRowBig標(biāo)志位秉版,用來判斷哪一個字符串的長度更長贤重,然后獲取更長的那個輸出。雖然實現(xiàn)了代碼清焕,但是感覺自己寫得很丑陋并蝗。

/**
 * 獲取數(shù)據(jù)之后返回數(shù)據(jù)到輸出Array中
 */
private void getResult() {
    // 獲取數(shù)值
    int rowSize = inputList.get(0).length();
    int colSize = inputList.get(1).length();
    int[][] array = new int[rowSize + 1][colSize + 1];
    char[] chars1 = inputList.get(0).toCharArray();
    char[] chars2 = inputList.get(1).toCharArray();
    String temp = new String();

    // 初始化數(shù)組
    for (int i = 0; i < rowSize; i++) array[i][0] = 0;
    for (int i = 0; i < colSize; i++) array[0][i] = 0;

    // 填空
    boolean isRowBig = true;
    if (rowSize >= colSize) {
        isRowBig = true;
    } else {
        isRowBig = false;
    }   // 雖然實現(xiàn)了代碼,但是感覺寫得特別丑陋秸妥。
    for (int i = 1; i <= rowSize; i++) {
        for (int j = 1; j <= colSize; j++) {
            if (chars1[i - 1] == chars2[j - 1]) {
                array[i][j] = array[i - 1][j - 1] + 1;
                if (isRowBig) {
                    temp += chars2[j - 1];
                } else {
                    temp += chars1[i - 1];
                }   // end if:正確向temp中添加了字符
            } else if (array[i - 1][j] >= array[i][j - 1]) {
                array[i][j] = array[i - 1][j];
            } else {
                array[i][j] = array[i][j - 1];
            }
        }
    }   // end for:array和temp中已經(jīng)保存了正確的數(shù)據(jù)

    outputList.add(temp);
 }

歡迎轉(zhuǎn)載滚停,轉(zhuǎn)載請注明出處!
簡書ID:@我沒有三顆心臟
github:wmyskxz
歡迎關(guān)注公眾微信號:wmyskxz_javaweb
分享自己的Java Web學(xué)習(xí)之路以及各種Java學(xué)習(xí)資料

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末筛峭,一起剝皮案震驚了整個濱河市铐刘,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌影晓,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,284評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件檩禾,死亡現(xiàn)場離奇詭異挂签,居然都是意外死亡,警方通過查閱死者的電腦和手機盼产,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,115評論 3 395
  • 文/潘曉璐 我一進店門饵婆,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人戏售,你說我怎么就攤上這事侨核。” “怎么了灌灾?”我有些...
    開封第一講書人閱讀 164,614評論 0 354
  • 文/不壞的土叔 我叫張陵搓译,是天一觀的道長。 經(jīng)常有香客問我锋喜,道長些己,這世上最難降的妖魔是什么豌鸡? 我笑而不...
    開封第一講書人閱讀 58,671評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮段标,結(jié)果婚禮上涯冠,老公的妹妹穿的比我還像新娘。我一直安慰自己逼庞,他們只是感情好蛇更,可當(dāng)我...
    茶點故事閱讀 67,699評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著赛糟,像睡著了一般派任。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上虑灰,一...
    開封第一講書人閱讀 51,562評論 1 305
  • 那天吨瞎,我揣著相機與錄音,去河邊找鬼穆咐。 笑死颤诀,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的对湃。 我是一名探鬼主播崖叫,決...
    沈念sama閱讀 40,309評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼拍柒!你這毒婦竟也來了心傀?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,223評論 0 276
  • 序言:老撾萬榮一對情侶失蹤拆讯,失蹤者是張志新(化名)和其女友劉穎脂男,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體种呐,經(jīng)...
    沈念sama閱讀 45,668評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡宰翅,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,859評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了爽室。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片汁讼。...
    茶點故事閱讀 39,981評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖阔墩,靈堂內(nèi)的尸體忽然破棺而出嘿架,到底是詐尸還是另有隱情,我是刑警寧澤啸箫,帶...
    沈念sama閱讀 35,705評論 5 347
  • 正文 年R本政府宣布耸彪,位于F島的核電站,受9級特大地震影響筐高,放射性物質(zhì)發(fā)生泄漏搜囱。R本人自食惡果不足惜丑瞧,卻給世界環(huán)境...
    茶點故事閱讀 41,310評論 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望蜀肘。 院中可真熱鬧绊汹,春花似錦、人聲如沸扮宠。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,904評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽坛增。三九已至获雕,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間收捣,已是汗流浹背届案。 一陣腳步聲響...
    開封第一講書人閱讀 33,023評論 1 270
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留罢艾,地道東北人楣颠。 一個月前我還...
    沈念sama閱讀 48,146評論 3 370
  • 正文 我出身青樓,卻偏偏與公主長得像咐蚯,于是被迫代替她去往敵國和親童漩。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,933評論 2 355

推薦閱讀更多精彩內(nèi)容