記錄使用node寫一個(gè)簡易爬蟲

準(zhǔn)備工作-使用到的模塊
//全局安裝自動(dòng)重啟工具nodemon
cnpm install -g  nodemon
cnpm i --save koa koa-router mysql cheerio superagent-charset superagent
----app.js----
const Koa = require('koa'),
app = new Koa(),
index = require('./routes/index');
app.use(index.routes(), index.allowedMethods());
app.listen(3000);

//路由信息
----/routes/index----
const router = require('koa-router')(),
  mysql = require('../db/mysql'),
  superagent = require('../caiji/superagent');
router.get('/caiji/:page', async (ctx, next) => {
  let page = ctx.params;
  let html = await superagent.get(`https://cnodejs.org/?tab=all&page=${page.page}`);
  if (html.length > 0) {
    try {
      let count = 0;
      for (let i in html) {
        await mysql.query(`insert into nodeData(title,userName,time) 
values('${html[i].title}','${html[i].userName}','${html[i].time}')`);
        count += 1
      }
      ctx.body = {
        code: 1,
        message: `該頁采集完成,共采集【${count}】條`
      }
    } catch (error) {
      ctx.body = {
        code: 0,
        message: `采集失敗:${error}`
      }
    }
  }
})
//"數(shù)據(jù)庫配置"
----/db/config----
module.exports = {
   DATABASE:'test',
        USERNAME:'root',
        PASSWORD:'zhy123456',
        PORT:'3306',
        HOST:'localhost'
}
----/db/mysql----
const mysql = require('mysql');
const config = require('./config');
let pool = mysql.createPool({
    host:config.HOST,
    user:config.USERNAME,
    password:config.PASSWORD,
    database:config.DATABASE
})

class Mysql{
    constructor(){

    }
    query(sql){
        console.log(sql)
        return new Promise((resolve,resject)=>{
            pool.query(sql,(err,res,fields)=>{
                if (err) {
                    throw err;
                }
                resolve(res)
            })
        })
    }
}
module.exports = new Mysql()
//采集模塊
----/db/caiji----
const cheerio = require('cheerio'),
    superagent = require('superagent'),
    charset = require('superagent-charset');
charset(superagent);
module.exports = {
    get(url) {
        return new Promise((resolve, reject) => {
            superagent.get(url)
                .charset('utf-8')
                .end((err, res) => {
                    if (err) {
                        resolve([])
                    }
                    if (res) {
                        let $ = cheerio.load(res.text, {
                            decodeEntities: false
                        })
                        let arr = [];
                        for (let i in $('.cell')) {
                            let title = $('.cell').eq(i).find('.topic_title').eq(0).html(),
                                userName = $('.cell').eq(i).find('.user_avatar').eq(0).find('img').eq(0).attr('title'),
                                time = $('.cell').eq(i).find('.last_active_time').eq(0).html(),
                                views = $('.cell').eq(i).find('.count_of_visits').eq(0).text();
                            if (title) {
                                arr.push({
                                    title: title.trim(),
                                    userName,
                                    time,
                                    views: views.trim()
                                })
                            }
                        }
                        resolve(arr)
                    } else {
                        resolve([])
                    }
                })
        })
    }
}
//啟動(dòng)
nodemon app.js
//瀏覽器地址
[http://127.0.0.1:3000/caiji/1](http://127.0.0.1:3000/caiji/1)
第一頁采集完成
![image.png](https://upload-images.jianshu.io/upload_images/5814981-6d1c2143f10bc9ca.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末累盗,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子它碎,更是在濱河造成了極大的恐慌历帚,老刑警劉巖辰晕,帶你破解...
    沈念sama閱讀 218,755評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異壮不,居然都是意外死亡血淌,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,305評論 3 395
  • 文/潘曉璐 我一進(jìn)店門谓厘,熙熙樓的掌柜王于貴愁眉苦臉地迎上來幌羞,“玉大人,你說我怎么就攤上這事竟稳∈翳耄” “怎么了熊痴?”我有些...
    開封第一講書人閱讀 165,138評論 0 355
  • 文/不壞的土叔 我叫張陵,是天一觀的道長聂宾。 經(jīng)常有香客問我愁拭,道長,這世上最難降的妖魔是什么亏吝? 我笑而不...
    開封第一講書人閱讀 58,791評論 1 295
  • 正文 為了忘掉前任岭埠,我火速辦了婚禮,結(jié)果婚禮上蔚鸥,老公的妹妹穿的比我還像新娘惜论。我一直安慰自己,他們只是感情好止喷,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,794評論 6 392
  • 文/花漫 我一把揭開白布馆类。 她就那樣靜靜地躺著,像睡著了一般弹谁。 火紅的嫁衣襯著肌膚如雪乾巧。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,631評論 1 305
  • 那天预愤,我揣著相機(jī)與錄音沟于,去河邊找鬼。 笑死植康,一個(gè)胖子當(dāng)著我的面吹牛旷太,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播销睁,決...
    沈念sama閱讀 40,362評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼供璧,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了冻记?” 一聲冷哼從身側(cè)響起睡毒,我...
    開封第一講書人閱讀 39,264評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎冗栗,沒想到半個(gè)月后演顾,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,724評論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡贞瞒,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,900評論 3 336
  • 正文 我和宋清朗相戀三年偶房,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片军浆。...
    茶點(diǎn)故事閱讀 40,040評論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡棕洋,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出乒融,到底是詐尸還是另有隱情掰盘,我是刑警寧澤摄悯,帶...
    沈念sama閱讀 35,742評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站愧捕,受9級特大地震影響奢驯,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜次绘,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,364評論 3 330
  • 文/蒙蒙 一瘪阁、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧邮偎,春花似錦管跺、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,944評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至泻云,卻和暖如春艇拍,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背宠纯。 一陣腳步聲響...
    開封第一講書人閱讀 33,060評論 1 270
  • 我被黑心中介騙來泰國打工卸夕, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人征椒。 一個(gè)月前我還...
    沈念sama閱讀 48,247評論 3 371
  • 正文 我出身青樓娇哆,卻偏偏與公主長得像,于是被迫代替她去往敵國和親勃救。 傳聞我的和親對象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,979評論 2 355