SpringBoot定時任務結合jsoup抓取網(wǎng)頁信息

由于測試環(huán)境需要一些測試數(shù)據(jù)或者壓測時需要大量的不重復的數(shù)據(jù)撮珠,可以使用SpringBoot定時任務 來抓取網(wǎng)站上 的證件號信息用來作為測試數(shù)據(jù)使用馏慨,本項目Github源碼

@Configuration
@EnableScheduling// 啟用定時任務
public class GetIdNos {

    @Autowired
    private UserService userService;

    @Scheduled(cron = "0/5 * * * * ?")// 每10秒執(zhí)行一次 抓取網(wǎng)頁的身份證信息保存到數(shù)據(jù)庫
    public void scheduler() throws Exception {
        DateFormat dateFormat = DateFormat.getDateTimeInstance();
        String time = dateFormat.format(new Date());

        String url = "https://hk.51240.com/";
        Document document = Jsoup.connect(url).get();
        Elements trElements = document.getElementsByTag("table").get(3).getElementsByTag("tr");
        for (int i = 1; i < trElements.size(); i++) {
            Elements tds = trElements.get(i).getElementsByTag("td");
            String name = tds.get(0).text();
            String idNo = tds.get(1).text();
            User user = userService.findUserByIdNo(idNo);
            if (StringUtils.isEmpty(user)) {
                userService.insert(new User(idNo, name, time));
            }
        }

    }
}
<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
         xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <modelVersion>4.0.0</modelVersion>

    <groupId>com.zhongan</groupId>
    <artifactId>GetPersonId</artifactId>
    <version>1.0-SNAPSHOT</version>

    <parent>
        <groupId>org.springframework.boot</groupId>
        <artifactId>spring-boot-starter-parent</artifactId>
        <version>2.1.4.RELEASE</version>
        <relativePath/> <!-- lookup parent from repository -->
    </parent>

    <properties>
        <java.version>1.8</java.version>
    </properties>

    <dependencies>
        <dependency>
            <groupId>org.springframework.boot</groupId>
            <artifactId>spring-boot-starter-jdbc</artifactId>
        </dependency>
        <dependency>
            <groupId>org.mybatis.spring.boot</groupId>
            <artifactId>mybatis-spring-boot-starter</artifactId>
            <version>2.0.1</version>
        </dependency>
        <dependency>
            <groupId>mysql</groupId>
            <artifactId>mysql-connector-java</artifactId>
            <version>8.0.15</version>
        </dependency>
        <dependency>
            <groupId>org.jsoup</groupId>
            <artifactId>jsoup</artifactId>
            <version>1.11.3</version>
        </dependency>
    </dependencies>


</project>

成功爬取信息并保存


image.png
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末重慢,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子麻掸,更是在濱河造成了極大的恐慌,老刑警劉巖轻黑,帶你破解...
    沈念sama閱讀 206,482評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異琴昆,居然都是意外死亡氓鄙,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,377評論 2 382
  • 文/潘曉璐 我一進店門椎咧,熙熙樓的掌柜王于貴愁眉苦臉地迎上來玖详,“玉大人,你說我怎么就攤上這事勤讽◇” “怎么了?”我有些...
    開封第一講書人閱讀 152,762評論 0 342
  • 文/不壞的土叔 我叫張陵脚牍,是天一觀的道長向臀。 經常有香客問我,道長诸狭,這世上最難降的妖魔是什么券膀? 我笑而不...
    開封第一講書人閱讀 55,273評論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮驯遇,結果婚禮上芹彬,老公的妹妹穿的比我還像新娘。我一直安慰自己叉庐,他們只是感情好舒帮,可當我...
    茶點故事閱讀 64,289評論 5 373
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著陡叠,像睡著了一般玩郊。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上枉阵,一...
    開封第一講書人閱讀 49,046評論 1 285
  • 那天译红,我揣著相機與錄音,去河邊找鬼兴溜。 笑死侦厚,一個胖子當著我的面吹牛,可吹牛的內容都是我干的拙徽。 我是一名探鬼主播刨沦,決...
    沈念sama閱讀 38,351評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼斋攀!你這毒婦竟也來了已卷?” 一聲冷哼從身側響起梧田,我...
    開封第一講書人閱讀 36,988評論 0 259
  • 序言:老撾萬榮一對情侶失蹤淳蔼,失蹤者是張志新(化名)和其女友劉穎侧蘸,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體鹉梨,經...
    沈念sama閱讀 43,476評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡讳癌,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 35,948評論 2 324
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了存皂。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片晌坤。...
    茶點故事閱讀 38,064評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖旦袋,靈堂內的尸體忽然破棺而出骤菠,到底是詐尸還是另有隱情,我是刑警寧澤疤孕,帶...
    沈念sama閱讀 33,712評論 4 323
  • 正文 年R本政府宣布商乎,位于F島的核電站,受9級特大地震影響祭阀,放射性物質發(fā)生泄漏鹉戚。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,261評論 3 307
  • 文/蒙蒙 一专控、第九天 我趴在偏房一處隱蔽的房頂上張望抹凳。 院中可真熱鬧,春花似錦伦腐、人聲如沸赢底。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,264評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽颖系。三九已至,卻和暖如春辩越,著一層夾襖步出監(jiān)牢的瞬間嘁扼,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,486評論 1 262
  • 我被黑心中介騙來泰國打工黔攒, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留趁啸,地道東北人。 一個月前我還...
    沈念sama閱讀 45,511評論 2 354
  • 正文 我出身青樓督惰,卻偏偏與公主長得像不傅,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子赏胚,可洞房花燭夜當晚...
    茶點故事閱讀 42,802評論 2 345

推薦閱讀更多精彩內容

  • Swift1> Swift和OC的區(qū)別1.1> Swift沒有地址/指針的概念1.2> 泛型1.3> 類型嚴謹 對...
    cosWriter閱讀 11,089評論 1 32
  • 筆友访娶,一個多么陌生的詞匯 現(xiàn)如今,有多少人每天連支筆都不曾握住 更無所謂筆友了 滴滴滴觉阅,不得不去點掉的微信小紅點 ...
    工程師姐夫閱讀 216評論 1 4
  • 早讀分享 2018年2月11日 星期日 我們都有缺點叮趴,所以彼此包容一點。 我們都有優(yōu)點权烧,所以彼此欣賞一點眯亦。 我們都...
    SYK晟蕓康時尚健康館閱讀 298評論 0 0
  • 馬云爸爸家的大日子即將到啦 各大電商大戰(zhàn)紛紛預熱 什么預付金板祝、定金攻略就是讓人膨脹 ...... 一大堆概念舌涨、一大...
    VO小超人閱讀 148評論 0 0
  • 作者:阿黎 今天是安瀾大家庭第一次團聚。雖說并非所有人都到場扔字,但八人的隊伍已經讓這個團隊有了家的感覺囊嘉。 真的很巧,...
    阿黎Aria閱讀 287評論 18 9