java爬取智聯(lián)招聘職位信息

第一次寫爬蟲嗦枢,案例比較簡(jiǎn)單,就在智聯(lián)招聘網(wǎng)站上爬取職位信息屯断。

技術(shù)點(diǎn):IO流文虏,集合,Jsoup使用殖演,以及前端的知識(shí)

這里寫圖片描述

代碼如下:

package com.wty.utils;

import java.io.BufferedReader;

import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.net.URL;
import java.net.URLConnection;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.List;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

/**
 * 
 *<p>Title:智聯(lián)招聘網(wǎng)站爬蟲小案例</p>
 *<p>Description:</p>
 *<p>Company:</p>
 *@author wty
 *@date 2017年3月11日上午11:28:01
 *
 */
public class DownWebPageUtils {
    public static String getHtmlCode(String url, String encoding) {
        URL uri =null;
        URLConnection urlConnection =null;
        InputStream inputStream =null;
        InputStreamReader inputStreamReader = null;
        BufferedReader bReader =null;
        StringBuffer sBuffer= new StringBuffer();
    
        try {
            // 建立網(wǎng)絡(luò)連接
             uri = new URL(url);
            // 打開(kāi)連接
             urlConnection = uri.openConnection();
            //輸入流
             inputStream = urlConnection.getInputStream();
            inputStreamReader = new InputStreamReader(inputStream, encoding);
            bReader = new BufferedReader(inputStreamReader);
            String temp;
            while ((temp = bReader.readLine()) != null) {
                sBuffer.append(temp + "\n");
            }

        } catch (Exception e) {
            e.printStackTrace();
            
        }finally {
            //關(guān)閉資源
            if(bReader!=null){
                try {
                    bReader.close();
                } catch (IOException e) {
                    e.printStackTrace();
                }
            }
        }
        return sBuffer.toString();
}
    public static List<HashMap<String, String>> analyzeHtml(String url, String encoding){
        String htmlCode = getHtmlCode(url, encoding);
        Document document = Jsoup.parse(htmlCode);
        Elements elements = document.getElementsByClass("newlist");
        List<HashMap<String, String>> list=new ArrayList<>();
        for (Element e : elements) {
            HashMap<String, String> map = new HashMap<>();
            String zwmc = e.getElementsByClass("zwmc").text();
            String gsmc = e.getElementsByClass("gsmc").text();
            String zwyx = e.getElementsByClass("zwyx").text();
            String gzdd = e.getElementsByClass("gzdd").text();
            String gxsj = e.getElementsByClass("gxsj").text();
            map.put("職位名稱:", zwmc);
            map.put("公司名稱", gsmc);
            map.put("職位月薪", zwyx);
            map.put("工作地點(diǎn)", gzdd);
            map.put("發(fā)布日期", gxsj);
            list.add(map);
        }
        
        return list;
    }
    public static void main(String[] args) {
        List<HashMap<String, String>> resultList = analyzeHtml("http://sou.zhaopin.com/jobs/searchresult.ashx?jl=%E4%B8%8A%E6%B5%B7&kw=java&sm=0&p=1", "UTF-8");
        System.out.println(resultList);
    }
}


數(shù)據(jù)可以在控制臺(tái)中打印出來(lái)氧秘,至于jsp頁(yè)面的展現(xiàn)筆者還沒(méi)寫,無(wú)非就是表格趴久,循環(huán)什么的丸相。有興趣的話可以寫一下。

感覺(jué)爬蟲還蠻好玩的彼棍。下次準(zhǔn)備爬個(gè)美圖網(wǎng)站灭忠。。座硕。hhhhh

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末弛作,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子华匾,更是在濱河造成了極大的恐慌映琳,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,311評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件蜘拉,死亡現(xiàn)場(chǎng)離奇詭異萨西,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)诸尽,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,339評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門原杂,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人您机,你說(shuō)我怎么就攤上這事穿肄∧昃郑” “怎么了?”我有些...
    開(kāi)封第一講書人閱讀 152,671評(píng)論 0 342
  • 文/不壞的土叔 我叫張陵咸产,是天一觀的道長(zhǎng)矢否。 經(jīng)常有香客問(wèn)我,道長(zhǎng)脑溢,這世上最難降的妖魔是什么僵朗? 我笑而不...
    開(kāi)封第一講書人閱讀 55,252評(píng)論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮屑彻,結(jié)果婚禮上验庙,老公的妹妹穿的比我還像新娘亲茅。我一直安慰自己横堡,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,253評(píng)論 5 371
  • 文/花漫 我一把揭開(kāi)白布寇钉。 她就那樣靜靜地躺著搏恤,像睡著了一般违寿。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上熟空,一...
    開(kāi)封第一講書人閱讀 49,031評(píng)論 1 285
  • 那天藤巢,我揣著相機(jī)與錄音,去河邊找鬼息罗。 笑死掂咒,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的阱当。 我是一名探鬼主播俏扩,決...
    沈念sama閱讀 38,340評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼弊添!你這毒婦竟也來(lái)了录淡?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書人閱讀 36,973評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤油坝,失蹤者是張志新(化名)和其女友劉穎嫉戚,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體澈圈,經(jīng)...
    沈念sama閱讀 43,466評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡彬檀,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,937評(píng)論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了瞬女。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片窍帝。...
    茶點(diǎn)故事閱讀 38,039評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖诽偷,靈堂內(nèi)的尸體忽然破棺而出坤学,到底是詐尸還是另有隱情疯坤,我是刑警寧澤,帶...
    沈念sama閱讀 33,701評(píng)論 4 323
  • 正文 年R本政府宣布深浮,位于F島的核電站压怠,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏飞苇。R本人自食惡果不足惜菌瘫,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,254評(píng)論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望布卡。 院中可真熱鬧雨让,春花似錦、人聲如沸羽利。這莊子的主人今日做“春日...
    開(kāi)封第一講書人閱讀 30,259評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)这弧。三九已至,卻和暖如春虚汛,著一層夾襖步出監(jiān)牢的瞬間匾浪,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書人閱讀 31,485評(píng)論 1 262
  • 我被黑心中介騙來(lái)泰國(guó)打工卷哩, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留蛋辈,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,497評(píng)論 2 354
  • 正文 我出身青樓将谊,卻偏偏與公主長(zhǎng)得像冷溶,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子尊浓,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,786評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容