python爬取豆瓣兩千萬圖書簡(jiǎn)介信息:(六)數(shù)據(jù)庫(kù)操作類

這是全部的調(diào)試過程疆虚,我已經(jīng)整理成為筆記仁连,這里分享給大家:
python爬取豆瓣兩千萬圖書簡(jiǎn)介信息:(一)目標(biāo)API分析
python爬取豆瓣兩千萬圖書簡(jiǎn)介信息:(二)簡(jiǎn)單python請(qǐng)求urllib2
python爬取豆瓣兩千萬圖書簡(jiǎn)介信息:(三)異常處理
python爬取豆瓣兩千萬圖書簡(jiǎn)介信息:(四)多進(jìn)程并發(fā)
python爬取豆瓣兩千萬圖書簡(jiǎn)介信息:(五)數(shù)據(jù)庫(kù)設(shè)計(jì)
python爬取豆瓣兩千萬圖書簡(jiǎn)介信息:(六)數(shù)據(jù)庫(kù)操作類
python爬取豆瓣兩千萬圖書簡(jiǎn)介信息:(七)代理IP
python爬取豆瓣兩千萬圖書簡(jiǎn)介信息:(八)總結(jié)

數(shù)據(jù)庫(kù)操作類

數(shù)據(jù)庫(kù)建好了,因?yàn)闃I(yè)務(wù)的單一性和頻發(fā)性昌罩,單獨(dú)做一個(gè)數(shù)據(jù)庫(kù)操作類在代碼管理上為好哭懈。

代碼如下:

# -*- coding:utf-8 -*-
import mysql.connector
import gc
import sys

default_encoding = 'utf-8'
if sys.getdefaultencoding() != default_encoding:
    reload(sys)

sys.setdefaultencoding(default_encoding)

def cb_conncet_sql(sql_query):
    # 創(chuàng)建數(shù)據(jù)庫(kù)連接方法
    config = {'host': 'localhost',
              'user': 'root',
              'password': 'root',
              'port': 3306,
              'database': 'doubanbook',
              'charset': 'utf8',
              'buffered': True
              }
    cnn = mysql.connector.connect(**config)
    try:
        cursor = cnn.cursor()
        cursor.execute(sql_query)
        cnn.commit()
        cds = cursor.fetchall()
        cb_print('查詢成功:'+ str(cds))
        return cds
    except mysql.connector.Error as e:
        if format(e) != 'No result set to fetch from.':
            cb_print('connect fails!{}'.format(e))
    finally:
        cursor.close()
        cnn.close()
        gc.collect()

def insert_book_info(par):
    # 解析bookinfo 并拼接SQL,插入數(shù)據(jù)庫(kù)
    if not par:
        cb_print('par 異常')
        return
    try:
        images = par['images']
        large_image = images['large']
        tags_dict = par['tags']
        tags = ''
        if tags_dict:
            for tag_item in tags_dict:
                tags = tags + tag_item['title'] + '&'
            tags = tags[:-1]
            tags = tags.replace('"', '')

        author_arr = par['author']
        author = ''
        if author_arr:
            for author_item in author_arr:
                author = author + author_item + '&'
            author = author[:-1]
            author = author.replace('"', '')

        rating = par['rating']
        average = rating['average']
        numraters = rating['numRaters']

        subtitle = par['subtitle']
        subtitle = subtitle.replace('"', '\'\'')
        if len(subtitle) > 250:
            subtitle = subtitle[0:250]

        title = par['title']
        title = title.replace('"', '\'\'')

        publisher = par['publisher']
        publisher = publisher.replace('"', '\'\'')

        binding = par['binding']
        binding = binding.replace('"', '\'\'')

        sql_query = ("INSERT INTO books (id, isbn13, publisher, pages,"
                     " title, image, alt, isbn10, "
                     "subtitle, "
                     "price, binding,"
                     "pubdate, large_image, "
                     "rating, numRaters,"
                     "tags, author) VALUES ("
                     + par['id'] + ','
                     + '"' + par['isbn13'] + '"' + ','
                     + '"' + publisher + '"' + ','
                     + '"' + par['pages'] + '"' + ','
                     + '"' + title + '"' + ','
                     + '"' + par['image'] + '"' + ','
                     + '"' + par['alt'] + '"' + ','
                     + '"' + par['isbn10'] + '"' + ','
                     + '"' + subtitle + '"' + ','
                     + '"' + par['price'] + '"' + ','
                     + '"' + binding + '"' + ','
                     + '"' + par['pubdate'] + '"' + ','
                     + '"' + large_image + '"' + ','
                     + '"' + str(average) + '"' + ','
                     + '"' + str(numraters) + '"' + ','
                     + '"' + tags + '"' + ','
                     + '"' + author + '"' + ');')
        cb_conncet_sql(sql_query)
    except Exception as e:
        if format(e) != 'No result set to fetch from.':
            cb_print('connect fails!{}'.format(e))
    finally:
        gc.collect()


def get_thread_index_id(index):
    # 獲取第index個(gè)進(jìn)程的最大bookid
    try:
        sql = ('select max(id) from books WHERE id < '
               + str(1000000 + (index + 1) * 50000) + ';')
        cb_print(sql)
        result = cb_conncet_sql(sql)
        if not result:
            return 0
        else:
            re = result[0]
            if not re:
                return 0
            else:
                return re[0]
    except Exception as e:
        if format(e) != 'No result set to fetch from.':
            cb_print('connect fails!{}'.format(e))
    finally:
        gc.collect()


def insert_error_book_id(index):
    # 將異常bookid 插入 error_books表中
    try:
        sql = 'INSERT INTO error_books (bookid) VALUES (' + str(index) + ');'
        cb_conncet_sql(sql)
    except Exception as e:
        if format(e) != 'No result set to fetch from.':
            cb_print('connect fails!{}'.format(e))
    finally:
        gc.collect()


def insert_none_book_id(index):
    # 將不存在書目的bookid 插入 none_books表中
    try:
        sql = 'INSERT INTO none_books (bookid) VALUES (' + str(index) + ');'
        cb_conncet_sql(sql)
    except Exception as e:
        if format(e) != 'No result set to fetch from.':
            cb_print('connect fails!{}'.format(e))
    finally:
        gc.collect()


最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末茎用,一起剝皮案震驚了整個(gè)濱河市遣总,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌轨功,老刑警劉巖旭斥,帶你破解...
    沈念sama閱讀 217,734評(píng)論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異古涧,居然都是意外死亡垂券,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,931評(píng)論 3 394
  • 文/潘曉璐 我一進(jìn)店門蒿褂,熙熙樓的掌柜王于貴愁眉苦臉地迎上來圆米,“玉大人,你說我怎么就攤上這事啄栓÷μ” “怎么了?”我有些...
    開封第一講書人閱讀 164,133評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵昙楚,是天一觀的道長(zhǎng)近速。 經(jīng)常有香客問我,道長(zhǎng)堪旧,這世上最難降的妖魔是什么削葱? 我笑而不...
    開封第一講書人閱讀 58,532評(píng)論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮淳梦,結(jié)果婚禮上析砸,老公的妹妹穿的比我還像新娘。我一直安慰自己爆袍,他們只是感情好首繁,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,585評(píng)論 6 392
  • 文/花漫 我一把揭開白布作郭。 她就那樣靜靜地躺著,像睡著了一般弦疮。 火紅的嫁衣襯著肌膚如雪夹攒。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,462評(píng)論 1 302
  • 那天胁塞,我揣著相機(jī)與錄音咏尝,去河邊找鬼。 笑死啸罢,一個(gè)胖子當(dāng)著我的面吹牛编检,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播伺糠,決...
    沈念sama閱讀 40,262評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼蒙谓,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了训桶?” 一聲冷哼從身側(cè)響起累驮,我...
    開封第一講書人閱讀 39,153評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎舵揭,沒想到半個(gè)月后谤专,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,587評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡午绳,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,792評(píng)論 3 336
  • 正文 我和宋清朗相戀三年置侍,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片拦焚。...
    茶點(diǎn)故事閱讀 39,919評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡蜡坊,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出赎败,到底是詐尸還是另有隱情秕衙,我是刑警寧澤,帶...
    沈念sama閱讀 35,635評(píng)論 5 345
  • 正文 年R本政府宣布僵刮,位于F島的核電站据忘,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏搞糕。R本人自食惡果不足惜勇吊,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,237評(píng)論 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望窍仰。 院中可真熱鬧汉规,春花似錦、人聲如沸驹吮。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,855評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至悟民,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間篷就,已是汗流浹背射亏。 一陣腳步聲響...
    開封第一講書人閱讀 32,983評(píng)論 1 269
  • 我被黑心中介騙來泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留竭业,地道東北人智润。 一個(gè)月前我還...
    沈念sama閱讀 48,048評(píng)論 3 370
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像未辆,于是被迫代替她去往敵國(guó)和親窟绷。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,864評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容

  • Android 自定義View的各種姿勢(shì)1 Activity的顯示之ViewRootImpl詳解 Activity...
    passiontim閱讀 172,116評(píng)論 25 707
  • Spring Cloud為開發(fā)人員提供了快速構(gòu)建分布式系統(tǒng)中一些常見模式的工具(例如配置管理咐柜,服務(wù)發(fā)現(xiàn)兼蜈,斷路器,智...
    卡卡羅2017閱讀 134,656評(píng)論 18 139
  • 需要原文的可以留下郵箱我給你發(fā)拙友,這里的文章少了很多圖为狸,懶得網(wǎng)上粘啦 1數(shù)據(jù)庫(kù)基礎(chǔ) 1.1數(shù)據(jù)庫(kù)定義 1)數(shù)據(jù)庫(kù)(D...
    極簡(jiǎn)純粹_閱讀 7,423評(píng)論 0 46
  • zhangcarming閱讀 170評(píng)論 0 0
  • 一棵樹喝多了陽光 長(zhǎng)上山頂 搖晃 快樂 風(fēng)是知道的 根往山腳下走 蔓延 痛苦 溪流知道 湖清楚知道 路過的...
    李唐的小詩(shī)閱讀 298評(píng)論 0 12