6.【動(dòng)態(tài)規(guī)劃】最長(zhǎng)公共子序列與最長(zhǎng)公共子串

寫(xiě)在前面

首先解釋一下二者的區(qū)別,最長(zhǎng)公共子序列(LCS)允許兩個(gè)公共的子序列在原有的兩個(gè)字符串中不連續(xù),即ABCFDEACFB,二者的最長(zhǎng)公共子序列為ACF;而最長(zhǎng)公共子串伍掀,要求連續(xù),其最長(zhǎng)公共子串為CF暇藏。

1. 最長(zhǎng)公共子序列

描述:給出兩個(gè)字符串蜜笤,找到最長(zhǎng)公共子序列(LCS),返回LCS的長(zhǎng)度盐碱。
題目鏈接:https://www.lintcode.com/problem/longest-common-subsequence/description

最長(zhǎng)公共子序列的定義:
最長(zhǎng)公共子序列問(wèn)題是在一組序列(通常2個(gè))中找到最長(zhǎng)公共子序列(注意:不同于子串把兔,LCS不需要是連續(xù)的子串)。該問(wèn)題是典型的計(jì)算機(jī)科學(xué)問(wèn)題瓮顽,是文件差異比較程序的基礎(chǔ)垛贤,在生物信息學(xué)中也有所應(yīng)用。
https://en.wikipedia.org/wiki/Longest_common_subsequence_problem

樣例 1:
    輸入:  "ABCD" and "EDCA"
    輸出:  1
    
    解釋:
    LCS 是 'A' 或  'D' 或 'C'

樣例 2:
    輸入: "ABCD" and "EACB"
    輸出:  2
    
    解釋: 
    LCS 是 "AC"

思路
這種雙序列動(dòng)態(tài)規(guī)劃的題目趣倾,一般是考慮如下幾種情況:

  1. 最后一步和子問(wèn)題:
    • 字符串A和字符串B的最后一個(gè)元素不相同聘惦,那其公共子序列需要用A[:n - 1] 和B或者**A和B[m - 1]去找。
    • 字符串A和字符串B的最后一個(gè)元素 相同儒恋,那其公共子序列需要用A[:n - 1] 和[m - 1]去找善绎。
  2. 轉(zhuǎn)移方程:
    使用一個(gè)二維矩陣去記錄兩個(gè)字符串的子序列之間最大公共子序列長(zhǎng)度。


    image
  3. 初始條件及邊界條件:
    當(dāng)序列為空是诫尽,與其他子序列的公共子序列長(zhǎng)度為空禀酱。因此,需要再加一維牧嫉,記錄空序列的長(zhǎng)度(即剂跟,長(zhǎng)度為0)减途。
  4. 計(jì)算順序
    從上到下,從左到右曹洽。
    image.png

    代碼實(shí)現(xiàn)
class Solution:
    """
    @param A: A string
    @param B: A string
    @return: The length of longest common subsequence of A and B
    """
    def longestCommonSubsequence(self, A, B):
        # write your code here
        if A == '' or B == '':
            return 0
        n = len(A)
        m = len(B)
        dp = [[0 for j in range(m + 1)] for i in range(n + 1)]
        for i in range(1, n+1):
            for j in range(1, m+1):
                if A[i - 1] == B[j - 1]:
                    dp[i][j] = dp[i - 1][j - 1] + 1
                else:
                    dp[i][j] = max(dp[i - 1][j], dp[i][j - 1])
        return dp[m][n]

1.1 進(jìn)階

還原最長(zhǎng)公共子序列鳍置,也就是把公共子序列打印出來(lái)。
這里需要再追加一個(gè)輔助數(shù)組flags數(shù)組送淆,這個(gè)數(shù)組的維度和剛才的dp數(shù)組相同税产。這個(gè)數(shù)組主要是用來(lái)記錄dp數(shù)組的每一步都執(zhí)行了什么操作。用3來(lái)表示A[i - 1] == B[j - 1]偷崩,用1來(lái)表示dp[i][j] = dp[i - 1][j]辟拷,用2來(lái)表示dp[i][j] = dp[i][j - 1]。我們從最后一個(gè)元素開(kāi)始還原,就是需要找到標(biāo)記為3的坐標(biāo)位置,然后根據(jù)A或者B還原出公共子序列汇陆。
具體代碼如下:

class Solution:
    """
    @param A: A string
    @param B: A string
    @return: The length of longest common subsequence of A and B
    """
    def longestCommonSubsequence(self, A, B):
        # write your code here
        if A == '' or B == '':
            return 0
        n = len(A)
        m = len(B)
        dp = [[0 for j in range(m + 1)] for i in range(n + 1)]
        flags = [[0 for j in range(m + 1)] for i in range(n + 1)] # 輔助標(biāo)記數(shù)組
        for i in range(1, n + 1):
            for j in range(1, m + 1):
                if A[i - 1] == B[j - 1]:
                    dp[i][j] = dp[i - 1][j - 1] + 1
                    flags[i - 1][j - 1] = 3
                else:
                    dp[i][j] = max(dp[i - 1][j], dp[i][j - 1])
                    if dp[i - 1][j] == dp[i][j]:
                        flags[i - 1][j] = 1 
                    else:
                        flags[i][j - 1] = 2
        s = ['' for i in range(dp[n][m])]
        p = dp[n][m] - 1
        row = n
        col = m
        while row > 0 and col > 0:
            if flags[row][col] == 1:
                row -= 1
            elif flags[row][col] == 2:
                col -= 1
            else:
                s[p] = A[row - 1]
                p -= 1
                row -= 1
                col -= 1

        return s

if __name__ == '__main__':
    s = Solution()
    A = 'abcd'
    B = 'wwawwbwwdwwwcwwd'
    print(s.longestCommonSubsequence(A,B))

2. 最長(zhǎng)公共子串

題目鏈接:https://www.lintcode.com/problem/longest-common-substring/description
題目描述:給出兩個(gè)字符串,找到最長(zhǎng)公共子串隅俘,并返回其長(zhǎng)度。
樣例 1:
輸入: "ABCD" and "CBCE"
輸出: 2

解釋:
最長(zhǎng)公共子串是 "BC"

樣例 2:
輸入: "ABCD" and "EACB"
輸出: 1

解釋: 
最長(zhǎng)公共子串是 'A' 或 'C' 或 'B'
  • 給出一個(gè)時(shí)間復(fù)雜度為O(n^2)的解法,這種方法效率太低到推。
class Solution:
    """
    @param A: A string
    @param B: A string
    @return: the length of the longest common substring.
    """
    def longestCommonSubstring(self, A, B):
        # write your code here
        if A == '' or B == '':
            return 0
        max_len = 0
        for i in range(len(A)):
            for j in range(i, len(A)):
                s = A[i:j+1]
                if s in B:
                    max_len = max(max_len, len(s))
        return max_len
  • 下面給出優(yōu)化:
    最長(zhǎng)公共子序列的做法基本一致考赛,只是有了連續(xù)的要求惕澎,因此莉测,狀態(tài)轉(zhuǎn)移方程需要改一下:
    image.png

    而且返回的也是最后一個(gè)結(jié)果了,需要一個(gè)max_length變量來(lái)記錄最大長(zhǎng)度唧喉。
class Solution:
    """
    @param A: A string
    @param B: A string
    @return: the length of the longest common substring.
    """
    def longestCommonSubstring(self, A, B):
        # write your code here
        if A == '' or B == '':
            return 0
        n = len(A)
        m = len(B)
        dp = [[0 for j in range(m + 1)] for i in range(n + 1)]
        max_length = 0
        for i in range(1, n+1):
            for j in range(1, m+1):
                if A[i - 1] == B[j - 1]:
                    dp[i][j] = dp[i - 1][j - 1] + 1
                else:
                    dp[i][j] = 0
                max_length = max(max_length, dp[i][j])
        return max_length
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末捣卤,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子八孝,更是在濱河造成了極大的恐慌董朝,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,036評(píng)論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件干跛,死亡現(xiàn)場(chǎng)離奇詭異子姜,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)楼入,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,046評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門(mén)哥捕,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人嘉熊,你說(shuō)我怎么就攤上這事遥赚。” “怎么了阐肤?”我有些...
    開(kāi)封第一講書(shū)人閱讀 164,411評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵凫佛,是天一觀的道長(zhǎng)讲坎。 經(jīng)常有香客問(wèn)我,道長(zhǎng)愧薛,這世上最難降的妖魔是什么晨炕? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,622評(píng)論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮厚满,結(jié)果婚禮上府瞄,老公的妹妹穿的比我還像新娘。我一直安慰自己碘箍,他們只是感情好遵馆,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,661評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著丰榴,像睡著了一般货邓。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上四濒,一...
    開(kāi)封第一講書(shū)人閱讀 51,521評(píng)論 1 304
  • 那天换况,我揣著相機(jī)與錄音,去河邊找鬼盗蟆。 笑死戈二,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的喳资。 我是一名探鬼主播觉吭,決...
    沈念sama閱讀 40,288評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼仆邓!你這毒婦竟也來(lái)了鲜滩?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 39,200評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤节值,失蹤者是張志新(化名)和其女友劉穎徙硅,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體搞疗,經(jīng)...
    沈念sama閱讀 45,644評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡嗓蘑,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,837評(píng)論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了匿乃。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片桩皿。...
    茶點(diǎn)故事閱讀 39,953評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖扳埂,靈堂內(nèi)的尸體忽然破棺而出业簿,到底是詐尸還是另有隱情,我是刑警寧澤阳懂,帶...
    沈念sama閱讀 35,673評(píng)論 5 346
  • 正文 年R本政府宣布梅尤,位于F島的核電站柜思,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏巷燥。R本人自食惡果不足惜赡盘,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,281評(píng)論 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望缰揪。 院中可真熱鬧陨享,春花似錦、人聲如沸钝腺。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,889評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)艳狐。三九已至定硝,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間毫目,已是汗流浹背蔬啡。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,011評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留镀虐,地道東北人箱蟆。 一個(gè)月前我還...
    沈念sama閱讀 48,119評(píng)論 3 370
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像刮便,于是被迫代替她去往敵國(guó)和親空猜。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,901評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容