查漏補缺

generator(生成器)

  1. 什么是生成器:

    • 把一個列表推倒式l = [x for x in range(10)]改成l = (x for x in range(10))就變成了一個生成器疮茄。
    • 一個函數(shù)中只要有yield那么也是一個生成器。
  2. 可迭代對象:

    • 一類是集合數(shù)據(jù)類型动雹,如list彩掐、tuple聚谁、dict、set垂券、str等苇羡;(字典遍歷定拟,打印出鍵)
    • 一類是generator,包括生成器和帶yieldgenerator function暂衡。

生成器和迭代器的區(qū)別:
可以理解為可以被next()函數(shù)調(diào)用并不斷返回下一個值的對象稱為迭代器,生成器一定是一個迭代器崖瞭;生成器只是一個保存的一個算法狂巢。

beautifulsoup4常用方法

語法:soup = BeautifulSoup(html,"lxml")

  1. find_all:返回所有元素的列表,bs4語法

    • soup.find_all("a")
    • soup.find_all(["a","b"])
    • soup.find_all(id="abc")
    • soup.find_all("input", attrs={"name":"_xsrf"})
    • soup.find_all('div', class__='t')
  2. select:返回所有元素的列表书聚,完全是CSS語法

    • soup.select("div")
    • soup.select(".nav")
    • soup.select("#nav")
    • soup.select("p #nav")
    • soup.select(".abc, .def")
    • soup.select("div[class='nav']")
    • soup.select("a[href='http://www.baidu.com']")
  3. 獲取內(nèi)容用get_text(),獲取屬性值get("value ")

創(chuàng)建多線程的方式

  1. threading模塊

    import threading
        
    
    def func():
        print "hello world"
    l = []  
    for i in range(5):
        thread = threading.Thread(target=func, args=[])
        thread.start()
        l.append(thread)
    for thread in l:
        thread.join()
    
  2. multiprocessing.dumpy模塊

    from multiprocessing.dumpy import Pool
    
    def func(a):
        print a
    pool = Pool(5)
    pool.map(func, [1,2,3,4,5]) -----> 它的結(jié)果是一個列表
    pool.close()
    pool.join()
    
  3. gevent版本

    import gevent
    from gevent import monkey
    mankey.patch_all()
    # 使用列表推導(dǎo)式將每個協(xié)程放到列表內(nèi)
    job_list = [gevent.spawn(func, args) for i in range(5)]
    gevent.joinall(job_list)
    
  4. tesseract庫的使用

    安裝好以后唧领,在終端輸入:

    $ tesseract XXX.jpg text # 就會在該路徑下生成一個text.txt文件
    
  5. subprocess的用法

    這個模塊可以實現(xiàn)在代碼中輸入執(zhí)行終端的命令藻雌。

    import subprocess
    subprocess.call(["ls","l"])  # 逗號就相當(dāng)于終端中輸入空格
    
  6. 通過meta傳參數(shù)

    def parse(self, response):
        yield scrapy.Request(url, callback=self.func, meta={"haha":item})
    
    def parse_item(self, response)
        # 取出傳遞過來的meta
        item = response.meta['haha']
    
  7. 字典的get()方法

    In [1]: dict = {'name':'johnny','age':'27'}
    In [2]: print(dict.get('name'))
    johnny
    In [3]: dict.get('sex')
    In [4]: print(dict.get('sex'))
    None
    
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市斩个,隨后出現(xiàn)的幾起案子胯杭,更是在濱河造成了極大的恐慌,老刑警劉巖受啥,帶你破解...
    沈念sama閱讀 211,496評論 6 491
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件做个,死亡現(xiàn)場離奇詭異,居然都是意外死亡滚局,警方通過查閱死者的電腦和手機居暖,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,187評論 3 385
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來核畴,“玉大人膝但,你說我怎么就攤上這事“荩” “怎么了跟束?”我有些...
    開封第一講書人閱讀 157,091評論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長丑孩。 經(jīng)常有香客問我冀宴,道長,這世上最難降的妖魔是什么温学? 我笑而不...
    開封第一講書人閱讀 56,458評論 1 283
  • 正文 為了忘掉前任略贮,我火速辦了婚禮,結(jié)果婚禮上仗岖,老公的妹妹穿的比我還像新娘逃延。我一直安慰自己,他們只是感情好轧拄,可當(dāng)我...
    茶點故事閱讀 65,542評論 6 385
  • 文/花漫 我一把揭開白布揽祥。 她就那樣靜靜地躺著,像睡著了一般檩电。 火紅的嫁衣襯著肌膚如雪拄丰。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,802評論 1 290
  • 那天俐末,我揣著相機與錄音料按,去河邊找鬼。 笑死卓箫,一個胖子當(dāng)著我的面吹牛载矿,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播烹卒,決...
    沈念sama閱讀 38,945評論 3 407
  • 文/蒼蘭香墨 我猛地睜開眼恢准,長吁一口氣:“原來是場噩夢啊……” “哼魂挂!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起馁筐,我...
    開封第一講書人閱讀 37,709評論 0 266
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎坠非,沒想到半個月后敏沉,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,158評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡炎码,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,502評論 2 327
  • 正文 我和宋清朗相戀三年盟迟,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片潦闲。...
    茶點故事閱讀 38,637評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡攒菠,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出歉闰,到底是詐尸還是另有隱情辖众,我是刑警寧澤,帶...
    沈念sama閱讀 34,300評論 4 329
  • 正文 年R本政府宣布和敬,位于F島的核電站凹炸,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏昼弟。R本人自食惡果不足惜啤它,卻給世界環(huán)境...
    茶點故事閱讀 39,911評論 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望舱痘。 院中可真熱鬧变骡,春花似錦、人聲如沸芭逝。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,744評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽铝耻。三九已至誊爹,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間瓢捉,已是汗流浹背频丘。 一陣腳步聲響...
    開封第一講書人閱讀 31,982評論 1 266
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留泡态,地道東北人搂漠。 一個月前我還...
    沈念sama閱讀 46,344評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像某弦,于是被迫代替她去往敵國和親桐汤。 傳聞我的和親對象是個殘疾皇子而克,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,500評論 2 348

推薦閱讀更多精彩內(nèi)容

  • 數(shù)據(jù)類型(也是對象來的) 整數(shù)(0xffe3)、浮點數(shù)(1.23e5==1.23*10的5次方)怔毛、字符串员萍、True...
    Gunter1993閱讀 263評論 0 0
  • 前言:C語言是Java、Objective-C拣度、C++等高級語言的基礎(chǔ)碎绎、也是跨平臺開發(fā)的基礎(chǔ),指針是C語言的重中之...
    androidjp閱讀 1,676評論 8 39
  • 參考文獻:《Java瘋狂講義》(第三版) run()方法:方法體即線程執(zhí)行體 線程Target 執(zhí)行體:run或c...
    houc閱讀 209評論 0 0
  • 要說冬天雪景哪兒最美 很多人肯定首選大東北 的確逮光,東北雪景名不虛傳 但今天小編要給大家說的這個地兒 比大東北可神奇...
    酷活動閱讀 395評論 0 0
  • 對于一位母親來說代箭,為了孩子所做的一切是無悔的。 當(dāng)一個嶄新的生命來到她的懷抱睦霎,除了感激還是感激梢卸,小時候母親心甘...
    了了無諍閱讀 149評論 0 1