187. Repeated DNA Sequences

All DNA is composed of a series of nucleotides abbreviated as A, C, G, and T, for example: "ACGAATTCCG". When studying DNA, it is sometimes useful to identify repeated sequences within the DNA.
Write a function to find all the 10-letter-long sequences (substrings) that occur more than once in a DNA molecule.

For example,

Given s = "AAAAACCCCCAAAAACCCCCCAAAAAGGGTTT",
Return:
["AAAAACCCCC", "CCCCCAAAAA"].

Solution1:Hashset<string> 查重

思路:

屏幕快照 2017-09-14 上午11.54.20.png

Time Complexity: O(N) Space Complexity: O(10N)

Solution2:先encode 再Hashset<int> 查重

Time Complexity: O(N) Space Complexity: O(N)

Solution1 Code:

public List<String> findRepeatedDnaSequences(String s) {
    Set seen = new HashSet(), repeated = new HashSet();
    for (int i = 0; i + 9 < s.length(); i++) {
        String ten = s.substring(i, i + 10);
        if (!seen.add(ten))
            repeated.add(ten);
    }
    return new ArrayList(repeated);
}

Solution2 Code:

class Solution {
    private char[] encode_map = new char[26];
    
    public List<String> findRepeatedDnaSequences(String s) {
        // init
        Set<Integer> seen = new HashSet<Integer>();
        Set<String> repeated = new HashSet<String>();
        //encode_map['A' - 'A'] = 0;
        encode_map['C' - 'A'] = 1;
        encode_map['G' - 'A'] = 2;
        encode_map['T' - 'A'] = 3;
        
        // sliding window
        for (int i = 0; i + 9 < s.length(); i++) {
            String ten = s.substring(i, i + 10);
            int code = encode(ten);
            if (!seen.add(code))
                repeated.add(ten);
        }
        
        // result
        return new ArrayList(repeated);
    }
    
    private int encode(String s) {
        int code = 0;
        for(int j = 0; j < 10; j++) {
            code <<= 2;
            code |= encode_map[s.charAt(j) - 'A'];
        }
        return code;
    }
}
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末崩哩,一起剝皮案震驚了整個濱河市弃衍,隨后出現(xiàn)的幾起案子丈咐,更是在濱河造成了極大的恐慌怒竿,老刑警劉巖膝舅,帶你破解...
    沈念sama閱讀 210,978評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件最楷,死亡現(xiàn)場離奇詭異揽咕,居然都是意外死亡腹泌,警方通過查閱死者的電腦和手機乡恕,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 89,954評論 2 384
  • 文/潘曉璐 我一進店門言询,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人傲宜,你說我怎么就攤上這事运杭。” “怎么了函卒?”我有些...
    開封第一講書人閱讀 156,623評論 0 345
  • 文/不壞的土叔 我叫張陵辆憔,是天一觀的道長。 經(jīng)常有香客問我报嵌,道長虱咧,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,324評論 1 282
  • 正文 為了忘掉前任锚国,我火速辦了婚禮腕巡,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘血筑。我一直安慰自己绘沉,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 65,390評論 5 384
  • 文/花漫 我一把揭開白布豺总。 她就那樣靜靜地躺著梆砸,像睡著了一般。 火紅的嫁衣襯著肌膚如雪园欣。 梳的紋絲不亂的頭發(fā)上帖世,一...
    開封第一講書人閱讀 49,741評論 1 289
  • 那天,我揣著相機與錄音沸枯,去河邊找鬼日矫。 笑死,一個胖子當(dāng)著我的面吹牛绑榴,可吹牛的內(nèi)容都是我干的哪轿。 我是一名探鬼主播,決...
    沈念sama閱讀 38,892評論 3 405
  • 文/蒼蘭香墨 我猛地睜開眼翔怎,長吁一口氣:“原來是場噩夢啊……” “哼窃诉!你這毒婦竟也來了杨耙?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,655評論 0 266
  • 序言:老撾萬榮一對情侶失蹤飘痛,失蹤者是張志新(化名)和其女友劉穎珊膜,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體宣脉,經(jīng)...
    沈念sama閱讀 44,104評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡车柠,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,451評論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了塑猖。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片竹祷。...
    茶點故事閱讀 38,569評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖羊苟,靈堂內(nèi)的尸體忽然破棺而出塑陵,到底是詐尸還是另有隱情,我是刑警寧澤蜡励,帶...
    沈念sama閱讀 34,254評論 4 328
  • 正文 年R本政府宣布猿妈,位于F島的核電站,受9級特大地震影響巍虫,放射性物質(zhì)發(fā)生泄漏彭则。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,834評論 3 312
  • 文/蒙蒙 一占遥、第九天 我趴在偏房一處隱蔽的房頂上張望俯抖。 院中可真熱鬧,春花似錦瓦胎、人聲如沸芬萍。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,725評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽柬祠。三九已至,卻和暖如春负芋,著一層夾襖步出監(jiān)牢的瞬間漫蛔,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,950評論 1 264
  • 我被黑心中介騙來泰國打工旧蛾, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留莽龟,地道東北人。 一個月前我還...
    沈念sama閱讀 46,260評論 2 360
  • 正文 我出身青樓锨天,卻偏偏與公主長得像毯盈,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子病袄,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,446評論 2 348

推薦閱讀更多精彩內(nèi)容

  • 2017.06.28 豆腐今天很勇敢的打了兩針防疫針搂赋,基本沒有哭鬧赘阀,為了保證側(cè)臥,我們背著一個大炮彈脑奠,特別聽話基公,特...
    morning糖閱讀 326評論 0 0
  • 文|聶魯達 今夜我可以寫下最哀傷的詩篇。 寫欠痴,譬如迄靠,“夜綴滿繁星尼变, 那些星晚碾,燦藍,在遠處顫抖征唬∑凶桑” 晚風(fēng)在天空中回旋...
    石勇_dfb8閱讀 345評論 0 0
  • 快進看完了西部世界的最后一集吠式,機器人終究還是意識覺醒,將人類這些偽神干翻在地抽米,羅伯特用他的生命作為貢品開啟了“Jo...
    范小白Van閱讀 315評論 0 0