使用jsoup抓取簡書的內容

抓取的是我博客的文章標題和鏈接阅嘶,使用map存儲,直接附上代碼:

/*
 * 時間:2016年十月
 * 作者:劉袆飛
 * 一個練習,使用jsoup獲取我的簡書的所有文章題目和鏈接信息
 */
package jsoup.com;

import org.jsoup.*;
import org.jsoup.nodes.Document;
import org.jsoup.select.Elements;
import org.jsoup.nodes.Element;
import java.util.*;

public class Main {
    public static void main(String[] args){

        try {
                       //申請兩個元素集合鲁驶,title存儲獲取到的分頁數(shù)據(jù)俱两,link存儲UI中的數(shù)據(jù)
            Elements title = null;
            Elements link = new Elements();
            
            //存儲獲取到的數(shù)據(jù),<鏈接作為KEY痛侍,text作為值>
            Map<String,String> map = new HashMap<>();
            
            for(int i =0;;i++){
            Document doc = Jsoup.connect("http://www.reibang.com/users/d2365eff6e41/latest_articles?page="+ i ).get();
            title = doc.getElementsByTag("h4");
            if(title.size() != 0){
                Iterator<Element> it = title.iterator();
                while(it.hasNext()){    
                    link.add(it.next().child(0));
                }
                
                title=null;
            }else
                break;
            }

            //吧元素集合里面的數(shù)據(jù)存儲到map中朝氓,鏈接取完整地址
            Iterator<Element> it = link.iterator();
            while(it.hasNext()){
                Element temp = it.next();
                map.put(temp.attr("abs:href"),temp.text());
            }
            System.out.println(map);
            
        } catch (Exception e) {
            System.out.println(e);
        }       
    }
}

輸出如下:

{http://www.reibang.com/p/4502b2802cf8=ArrayList練習-去掉重復元素, 
http://www.reibang.com/p/5565e5c59afd=單表替換密碼, 
http://www.reibang.com/p/f23ec9da6ecf=java集合, 
http://www.reibang.com/p/655c2ea168b0=面向對象練習二, 
http://www.reibang.com/p/0eb7a2030b6d=java集合-Set, 
http://www.reibang.com/p/56c9bcc713a2=Killer網(wǎng)卡未正確映射ISP問題解決辦法, 
http://www.reibang.com/p/9e5d38c36373=蒙塔卡羅法計算π, 
http://www.reibang.com/p/58b92b4a428a=維吉尼亞加密遇到的問題, 
http://www.reibang.com/p/42b914293435=重裝Win7后無法獲取更新解決辦法, 
http://www.reibang.com/p/6c65417f1237=我的鍵盤, 
http://www.reibang.com/p/ad52b1207a9a=國慶寫代碼, 
http://www.reibang.com/p/d9141fccc345=驗證哥德巴赫猜想, 
http://www.reibang.com/p/b3d9c603d2c8=Comparator練習-String按照長度比較, 
http://www.reibang.com/p/aba38279d14f=Oracle數(shù)據(jù)庫學習整理, 
http://www.reibang.com/p/d0505d11c819=巧用windows任務欄, 
http://www.reibang.com/p/5af00815b4e4=vim基本操作命令, 
http://www.reibang.com/p/83d2f2f8fff5=維吉尼亞加密, 
http://www.reibang.com/p/73d5494af3fb=維吉尼亞密碼加密文件, 
http://www.reibang.com/p/03f4d1ec9cae=PL/SQL筆記, 
http://www.reibang.com/p/644b42f87896=鍵盤黨的網(wǎng)頁瀏覽--Vimium, 
http://www.reibang.com/p/76107670e975=面向對象練習三, 
http://www.reibang.com/p/4989b9107a2e=Windows下使用藍燈(lantern)后部分軟件無法上網(wǎng)問題, 
http://www.reibang.com/p/f70c6424dab3=泛型}
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市主届,隨后出現(xiàn)的幾起案子赵哲,更是在濱河造成了極大的恐慌,老刑警劉巖君丁,帶你破解...
    沈念sama閱讀 222,183評論 6 516
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件枫夺,死亡現(xiàn)場離奇詭異,居然都是意外死亡绘闷,警方通過查閱死者的電腦和手機橡庞,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,850評論 3 399
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來印蔗,“玉大人扒最,你說我怎么就攤上這事』冢” “怎么了吧趣?”我有些...
    開封第一講書人閱讀 168,766評論 0 361
  • 文/不壞的土叔 我叫張陵,是天一觀的道長耙厚。 經(jīng)常有香客問我强挫,道長,這世上最難降的妖魔是什么薛躬? 我笑而不...
    開封第一講書人閱讀 59,854評論 1 299
  • 正文 為了忘掉前任俯渤,我火速辦了婚禮,結果婚禮上型宝,老公的妹妹穿的比我還像新娘稠诲。我一直安慰自己侦鹏,他們只是感情好,可當我...
    茶點故事閱讀 68,871評論 6 398
  • 文/花漫 我一把揭開白布臀叙。 她就那樣靜靜地躺著略水,像睡著了一般。 火紅的嫁衣襯著肌膚如雪劝萤。 梳的紋絲不亂的頭發(fā)上渊涝,一...
    開封第一講書人閱讀 52,457評論 1 311
  • 那天,我揣著相機與錄音床嫌,去河邊找鬼跨释。 笑死,一個胖子當著我的面吹牛厌处,可吹牛的內容都是我干的鳖谈。 我是一名探鬼主播,決...
    沈念sama閱讀 40,999評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼阔涉,長吁一口氣:“原來是場噩夢啊……” “哼缆娃!你這毒婦竟也來了?” 一聲冷哼從身側響起瑰排,我...
    開封第一講書人閱讀 39,914評論 0 277
  • 序言:老撾萬榮一對情侶失蹤贯要,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后椭住,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體崇渗,經(jīng)...
    沈念sama閱讀 46,465評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 38,543評論 3 342
  • 正文 我和宋清朗相戀三年京郑,在試婚紗的時候發(fā)現(xiàn)自己被綠了宅广。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,675評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡些举,死狀恐怖跟狱,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情金拒,我是刑警寧澤兽肤,帶...
    沈念sama閱讀 36,354評論 5 351
  • 正文 年R本政府宣布套腹,位于F島的核電站绪抛,受9級特大地震影響,放射性物質發(fā)生泄漏电禀。R本人自食惡果不足惜幢码,卻給世界環(huán)境...
    茶點故事閱讀 42,029評論 3 335
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望尖飞。 院中可真熱鬧症副,春花似錦店雅、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,514評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至辕坝,卻和暖如春窍奋,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背酱畅。 一陣腳步聲響...
    開封第一講書人閱讀 33,616評論 1 274
  • 我被黑心中介騙來泰國打工琳袄, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人纺酸。 一個月前我還...
    沈念sama閱讀 49,091評論 3 378
  • 正文 我出身青樓窖逗,卻偏偏與公主長得像,于是被迫代替她去往敵國和親餐蔬。 傳聞我的和親對象是個殘疾皇子碎紊,可洞房花燭夜當晚...
    茶點故事閱讀 45,685評論 2 360

推薦閱讀更多精彩內容

  • Android 自定義View的各種姿勢1 Activity的顯示之ViewRootImpl詳解 Activity...
    passiontim閱讀 172,305評論 25 707
  • Spring Cloud為開發(fā)人員提供了快速構建分布式系統(tǒng)中一些常見模式的工具(例如配置管理,服務發(fā)現(xiàn)用含,斷路器矮慕,智...
    卡卡羅2017閱讀 134,711評論 18 139
  • 最近痴鳄,我犯了個規(guī)矩——去閨蜜單位上班。 大家都是成年人 了缸夹,很多問題就得提前想到痪寻,去之前,我們就討論過在單位相處的...
    碩碩66閱讀 597評論 0 2
  • 吃過晚飯,我對4歲的兒子說:“媽媽教你三字經(jīng)吧芽唇」嘶”說著我拿出了早已為他準備好的三字經(jīng)念了起來…… “人之初...
    貓讓忍閱讀 207評論 0 1
  • 我很喜歡看電視,電視里的那些小動物們一個一個都會說話,真是有趣極了,我是百看不厭。但是媽媽很少讓我看電視,她說對視...
    利萍閱讀 765評論 0 0