搞了一個(gè)下午,記錄一下備忘。
百度沒有為Python開發(fā)官方的PCS-sdk瞧哟。一開始使用了hdpfans論壇的jackyspy大大在kodi百度云插件中封裝的pcsapi混巧,木有文檔。搗鼓了半天勤揩,無論是調(diào)用這個(gè)pcsapi咧党,還是利用百度的rest api,均返回錯(cuò)誤陨亡,可能是沒有權(quán)限傍衡。
{"error_code":4,"error_msg":"No permission to do this operation","request_id":2294753058}
后來使用了latyas在github上開源的baidupcsapi,文檔原本掛掉了负蠕,聯(lián)系作者后他很認(rèn)真地重做了聪舒。真感動(dòng),對(duì)于我這種菜鳥沒文檔根本無處著手虐急。
然而latyas似乎采用的是模擬登陸的方式進(jìn)行的開發(fā),這就帶來了驗(yàn)證碼的問題滔迈。
在api中止吁,如果不設(shè)置回調(diào)函數(shù)(其實(shí)我不知道什么叫做回調(diào)函數(shù)),PCS類會(huì)默認(rèn)將jpeg文件二進(jìn)制信息打印在命令行上燎悍,然后手動(dòng)輸入敬惦。
暫時(shí)不會(huì)解決驗(yàn)證碼自動(dòng)識(shí)別的問題,也許有庫(kù)可以解決谈山。我自定義了一個(gè)函數(shù)俄删,將圖片文件信息以二進(jìn)制的方式寫入一個(gè)jpg文件庞萍,打開肉眼識(shí)別后手動(dòng)輸入允乐。
事實(shí)上短時(shí)間內(nèi)只需要輸入一次就夠了。
解決了登陸問題癞埠,經(jīng)過一連串的低級(jí)錯(cuò)誤和不明所以的探索之后鸽粉,終于成功調(diào)用了離線下載的方法斜脂。
將從www.zimuzu.com批量導(dǎo)出的電驢鏈接復(fù)制到txt文件中,調(diào)用readlines方法触机,加上循環(huán)帚戳,這些都是小學(xué)生都能做的事。
代碼都還沒整理儡首,目前只能是一堆面向過程的玩意片任。