2019-03-08 利用crontab定時啟停爬蟲

緣起:

公司有個爬蟲項(xiàng)目睛藻,它會爬取一些指定的數(shù)據(jù)到測試服務(wù)器的數(shù)據(jù)庫,現(xiàn)狀是
 ⊙ρ怠①每日我早上啟動恨旱,到晚上關(guān)閉(中間可能會自動停)辈毯;
  ②我從測試服務(wù)器導(dǎo)出新增數(shù)據(jù)給老大搜贤,老大負(fù)責(zé)放到線上谆沃。

愿景:

①爬蟲定時自動啟停;
 ∫敲ⅰ②數(shù)據(jù)定時自動導(dǎo)出唁影,上傳到老大指定的一個位置,剩下的他接管掂名。

打怪記錄:

  • 腳本1据沈,啟動爬蟲項(xiàng)目:
    沒什么好說的,因?yàn)轫?xiàng)目已經(jīng)將所有爬蟲的啟動集中到main.py文件中饺蔑,記得改掉文件權(quán)限锌介。

  • 腳本2,殺死爬蟲項(xiàng)目:
    問題①:根據(jù)進(jìn)程名中關(guān)鍵字殺死進(jìn)程及其子孫進(jìn)程的命令
    ps -ef | grep procedure_name | grep -v grep | awk '{print $2}' | xargs kill -9

  • 腳本3,自動導(dǎo)出數(shù)據(jù)庫數(shù)據(jù)孔祸,上傳到服務(wù)器
    問題①:數(shù)據(jù)庫是mysql隆敢,我使用mysqldump命令不想寫入明文密碼;
    問題②:我導(dǎo)出的數(shù)據(jù)不想有創(chuàng)建表結(jié)構(gòu)的語句融击;
    問題③:我導(dǎo)出數(shù)據(jù)時筑公,不想鎖表,因?yàn)榭赡芘老x還在爬尊浪,在輸出的文件里,也不想增加 LOCK TABLES t WRITE;
    問題④:我只想導(dǎo)出時間是最新的數(shù)據(jù)封救。
    解:這四個問題都可以在一行命令內(nèi)解決
    mysqldump --default-file=配置文件 --no-create-info --single-transaction --add-locks=0 --where="time > today" --result-file=data.sql;
    說明:
      --default-file=文件路徑拇涤,通過配置文件連接mysql客戶端,解決了問題①誉结;
      --no-create-info 表示不需要導(dǎo)出創(chuàng)建表結(jié)構(gòu)語句鹅士;
      --single-transaction 導(dǎo)出數(shù)據(jù)的時候不需要對表加表鎖,不影響爬蟲惩坑;
      --add-locks=0 表示輸出的文件里掉盅,沒有插入數(shù)據(jù)前的鎖表語句;
      --where=條件以舒,可以指定要導(dǎo)出數(shù)據(jù)滿足的條件
    問題⑤:shell腳本中怎樣獲取當(dāng)前日期并賦值給變量趾痘?
    解:
      獲取當(dāng)前日期 tod=date +%Y-%m-%d(2019-03-08)
      獲取昨天日期 yes=date -d 'last day' +%Y%m%d(mac上試了不好使)

  • crontab的配置:
    參考

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市蔓钟,隨后出現(xiàn)的幾起案子永票,更是在濱河造成了極大的恐慌,老刑警劉巖滥沫,帶你破解...
    沈念sama閱讀 219,427評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件侣集,死亡現(xiàn)場離奇詭異,居然都是意外死亡兰绣,警方通過查閱死者的電腦和手機(jī)世分,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,551評論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來缀辩,“玉大人臭埋,你說我怎么就攤上這事〈瞥危” “怎么了斋泄?”我有些...
    開封第一講書人閱讀 165,747評論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長镐牺。 經(jīng)常有香客問我炫掐,道長,這世上最難降的妖魔是什么睬涧? 我笑而不...
    開封第一講書人閱讀 58,939評論 1 295
  • 正文 為了忘掉前任募胃,我火速辦了婚禮旗唁,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘痹束。我一直安慰自己检疫,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,955評論 6 392
  • 文/花漫 我一把揭開白布祷嘶。 她就那樣靜靜地躺著屎媳,像睡著了一般。 火紅的嫁衣襯著肌膚如雪论巍。 梳的紋絲不亂的頭發(fā)上烛谊,一...
    開封第一講書人閱讀 51,737評論 1 305
  • 那天,我揣著相機(jī)與錄音嘉汰,去河邊找鬼丹禀。 笑死,一個胖子當(dāng)著我的面吹牛鞋怀,可吹牛的內(nèi)容都是我干的双泪。 我是一名探鬼主播,決...
    沈念sama閱讀 40,448評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼密似,長吁一口氣:“原來是場噩夢啊……” “哼焙矛!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起辛友,我...
    開封第一講書人閱讀 39,352評論 0 276
  • 序言:老撾萬榮一對情侶失蹤薄扁,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后废累,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體邓梅,經(jīng)...
    沈念sama閱讀 45,834評論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,992評論 3 338
  • 正文 我和宋清朗相戀三年邑滨,在試婚紗的時候發(fā)現(xiàn)自己被綠了日缨。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,133評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡掖看,死狀恐怖匣距,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情哎壳,我是刑警寧澤毅待,帶...
    沈念sama閱讀 35,815評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站归榕,受9級特大地震影響尸红,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,477評論 3 331
  • 文/蒙蒙 一外里、第九天 我趴在偏房一處隱蔽的房頂上張望怎爵。 院中可真熱鬧,春花似錦盅蝗、人聲如沸鳖链。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,022評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽芙委。三九已至,卻和暖如春狂秦,著一層夾襖步出監(jiān)牢的瞬間题山,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,147評論 1 272
  • 我被黑心中介騙來泰國打工故痊, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人玖姑。 一個月前我還...
    沈念sama閱讀 48,398評論 3 373
  • 正文 我出身青樓愕秫,卻偏偏與公主長得像,于是被迫代替她去往敵國和親焰络。 傳聞我的和親對象是個殘疾皇子戴甩,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,077評論 2 355

推薦閱讀更多精彩內(nèi)容

  • 在編寫shell腳本的時候,可能會遇到操作mysql數(shù)據(jù)庫的情況。下面介紹如何在shell腳本中操作mysql數(shù)據(jù)...
    ifcoder閱讀 2,606評論 0 2
  • 1.A simple master-to-slave replication is currently being...
    Kevin關(guān)大大閱讀 5,969評論 0 3
  • MYSQL 基礎(chǔ)知識 1 MySQL數(shù)據(jù)庫概要 2 簡單MySQL環(huán)境 3 數(shù)據(jù)的存儲和獲取 4 MySQL基本操...
    Kingtester閱讀 7,818評論 5 116
  • 雖然不能恢復(fù)百分百闪彼,至少能將損失降到最低甜孤。 有個問題測試: 主從同步時,主庫網(wǎng)絡(luò)斷開畏腕,binlog dump線程...
    kun_zhang閱讀 3,039評論 0 6
  • ORA-00001: 違反唯一約束條件 (.) 錯誤說明:當(dāng)在唯一索引所對應(yīng)的列上鍵入重復(fù)值時缴川,會觸發(fā)此異常。 O...
    我想起個好名字閱讀 5,320評論 0 9