初學(xué)爬蟲——java實現(xiàn)

1.尋找本地指定文件上的郵箱帳號

public class TestDemo {
    public static void main(String[] args) throws IOException {
        List<String> list = getMails();
        for(String Mails:list){
            System.out.println(Mails);
        }
    }
    
    public static List<String> getMails() throws IOException{
        BufferedReader br = new BufferedReader(new FileReader("d:\\BugReport.txt"));//D盤中放了一個BugReport.txt文件
        String regex = "\\w+@\\w+(\\.\\w+)+";
        List<String> list = new ArrayList<String>();
        Pattern p = Pattern.compile(regex);
        String line = null;
        while((line=br.readLine())!=null){
            Matcher m = p.matcher(line);
            while(m.find()){
                list.add(m.group());
            }
        }
        return list;
    }
}

2.尋找任一網(wǎng)頁上的郵箱帳號,這里以貼吧上的留郵箱帖子為例,獲取該網(wǎng)頁上的所有郵箱:

public class TestDemo {
    public static void main(String[] args) throws IOException {
        List<String> list = getMailsByWEB();
        for(String Mails:list){
            System.out.println(Mails);
        }
    }
    
    public static List<String> getMailsByWEB() throws IOException{
        URL url = new URL("http://tieba.baidu.com/p/2314539885");
        BufferedReader br = new BufferedReader(new InputStreamReader(url.openStream()));
        String regex = "\\w+@\\w+(\\.\\w+)+";
        List<String> list = new ArrayList<String>();
        Pattern p = Pattern.compile(regex);
        String line = null;
        while((line=br.readLine())!=null){
            Matcher m = p.matcher(line);
            while(m.find()){
                list.add(m.group());
            }
        }
        return list;
    }
}
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末必指,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌目代,老刑警劉巖,帶你破解...
    沈念sama閱讀 222,729評論 6 517
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件嗤练,死亡現(xiàn)場離奇詭異榛了,居然都是意外死亡,警方通過查閱死者的電腦和手機煞抬,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,226評論 3 399
  • 文/潘曉璐 我一進店門霜大,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人革答,你說我怎么就攤上這事战坤。” “怎么了残拐?”我有些...
    開封第一講書人閱讀 169,461評論 0 362
  • 文/不壞的土叔 我叫張陵途茫,是天一觀的道長。 經(jīng)常有香客問我溪食,道長囊卜,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 60,135評論 1 300
  • 正文 為了忘掉前任眠菇,我火速辦了婚禮边败,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘捎废。我一直安慰自己笑窜,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 69,130評論 6 398
  • 文/花漫 我一把揭開白布登疗。 她就那樣靜靜地躺著排截,像睡著了一般。 火紅的嫁衣襯著肌膚如雪辐益。 梳的紋絲不亂的頭發(fā)上断傲,一...
    開封第一講書人閱讀 52,736評論 1 312
  • 那天,我揣著相機與錄音智政,去河邊找鬼认罩。 笑死,一個胖子當(dāng)著我的面吹牛续捂,可吹牛的內(nèi)容都是我干的垦垂。 我是一名探鬼主播宦搬,決...
    沈念sama閱讀 41,179評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼劫拗!你這毒婦竟也來了间校?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 40,124評論 0 277
  • 序言:老撾萬榮一對情侶失蹤页慷,失蹤者是張志新(化名)和其女友劉穎憔足,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體酒繁,經(jīng)...
    沈念sama閱讀 46,657評論 1 320
  • 正文 獨居荒郊野嶺守林人離奇死亡滓彰,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,723評論 3 342
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了欲逃。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片找蜜。...
    茶點故事閱讀 40,872評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖稳析,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情弓叛,我是刑警寧澤彰居,帶...
    沈念sama閱讀 36,533評論 5 351
  • 正文 年R本政府宣布,位于F島的核電站撰筷,受9級特大地震影響陈惰,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜毕籽,卻給世界環(huán)境...
    茶點故事閱讀 42,213評論 3 336
  • 文/蒙蒙 一抬闯、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧关筒,春花似錦溶握、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,700評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至袍榆,卻和暖如春胀屿,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背包雀。 一陣腳步聲響...
    開封第一講書人閱讀 33,819評論 1 274
  • 我被黑心中介騙來泰國打工宿崭, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人才写。 一個月前我還...
    沈念sama閱讀 49,304評論 3 379
  • 正文 我出身青樓葡兑,卻偏偏與公主長得像奴愉,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子铁孵,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,876評論 2 361

推薦閱讀更多精彩內(nèi)容

  • 社交紅利閱讀筆記 書名:社交紅利(修訂升級版) 作者:徐志斌 出版社:中信出版社 正文前筆記: 推薦序1摘要 社交...
    鳧水閱讀 8,967評論 4 26
  • 點擊查看原文 Web SDK 開發(fā)手冊 SDK 概述 網(wǎng)易云信 SDK 為 Web 應(yīng)用提供一個完善的 IM 系統(tǒng)...
    layjoy閱讀 13,787評論 0 15
  • Android 自定義View的各種姿勢1 Activity的顯示之ViewRootImpl詳解 Activity...
    passiontim閱讀 172,332評論 25 707
  • 小時候锭硼,喜歡靜靜的一個人待著,可以一整天甚至幾天不說話蜕劝,就那樣待在屬于自己的世界里與世無爭檀头。長大后因為普通的長相,...
    真水無香_2b44閱讀 508評論 0 0
  • 時光匆匆岖沛,轉(zhuǎn)眼間小侄兒已經(jīng)兩歲了暑始。 朋友圈里表妹和弟妹都發(fā)了蛋糕、蠟燭婴削。 小侄兒是表弟家的孩子廊镜,表弟小我一歲,三年...
    時間的光閱讀 248評論 2 2