Python爬蟲系列集合:VIP音樂+小說+彈幕,都在這里集合了

最近碑隆,有小粉絲在后臺(tái)私信我恭陡,說:小Q啊,我這邊按照你之前的教程上煤,去獲取一些小說的內(nèi)容休玩,想要自己私下看,但是為什么劫狠,我拿到這些小說之后哥捕,全都是亂碼啊,就像下面這個(gè)樣子

圖片

我也encoding=‘utf-8’去進(jìn)行相應(yīng)的修改了嘉熊,但是還是有問題怎么回事啊,我看了一下扬舒,他在最一開始的時(shí)候阐肤,獲取到網(wǎng)頁信息的時(shí)候就已經(jīng)是亂碼了,如何獲取網(wǎng)站的響應(yīng)信息呢讲坎?大家可以看這里孕惜,這是我之前寫的文章,有詳細(xì)的圖文解析:

五步帶你探究爬蟲爬取視頻彈幕背后的真相晨炕,附爬蟲實(shí)現(xiàn)源碼

注意:這個(gè)連接中有一個(gè)獲取源碼的小項(xiàng)目衫画,但是,現(xiàn)在這個(gè)小項(xiàng)目進(jìn)行了更新瓮栗,B站為了讓彈幕數(shù)量更高一些削罩,所以采用了一種加密和壓縮的新格式,解決方案有兩種

第一種:采用復(fù)雜的解密方法

第二種:很簡單

#這是原地址  https://api.bilibili.com/x/v2/dm/web/history/seg.so?type=1&oid=106015992&date=2021-01-20# url是新的地址
> url='https://api.bilibili.com/x/v2/dm/history?type=1&oid=106015992&date=2021-01-20'

就是刪除web以及seg.so即可

大家可以去嘗試一下

這里啊费奸,也教初學(xué)者一點(diǎn)小技巧弥激,當(dāng)你的實(shí)現(xiàn)邏輯沒有問題,也覺得這個(gè)應(yīng)該不是我們的代碼問題愿阐,那可以通過print方法微服,每一步去打印相應(yīng)的結(jié)果,看是哪一步出現(xiàn)的問題

圖片

類似這個(gè)樣子缨历,這樣的話以蕴,你可以查看到每一步的結(jié)果糙麦,就知道到底是哪一步出現(xiàn)問題,對(duì)于初學(xué)者丛肮,可以更好地理解相應(yīng)的方法實(shí)現(xiàn)赡磅,也能找到到底是那一步出現(xiàn)問題,下面把我這個(gè)小粉絲的代碼以及需求分享給大家

#需求:爬取三國演義小說所有的章節(jié)標(biāo)題和章節(jié)內(nèi)容
#https://www.shicimingju.com/book/sanguoyanyi.html
import requests
from bs4 import BeautifulSoup
import lxml
?
# UA偽裝
headers = {
 'User-Agent': "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.183 Safari/537.36"
}
?
url = 'https://www.shicimingju.com/book/sanguoyanyi.html'
?
page_text = requests.get(url=url,headers=headers)
page_text.encoding='utf-8'
?
# 在首頁中解析出文章的標(biāo)題和詳情頁的url
# 1 實(shí)例化BeautifulSoup對(duì)象 需要將頁面源碼的數(shù)據(jù)加載到該對(duì)象中
?
soup = BeautifulSoup(page_text.text,"lxml")
?
?
# 解析章節(jié)標(biāo)題和詳情頁的url
li_list = soup.select(".book-mulu > ul > li")
?
print(li_list)
fp = open("./sanguo.txt",'w',encoding="utf-8")
print(fp)
for li in li_list:
 title = li.a.string

 detail_url = "https://www.shicimingju.com"+li.a["href"]
 # 對(duì)詳情頁發(fā)起請(qǐng)求 解析章節(jié)內(nèi)容
 detail_url_text = requests.get(url=detail_url,headers=headers)
 detail_url_text.encoding='utf-8'
 # 解析出詳情頁相關(guān)的章節(jié)內(nèi)容
 detail_soup = BeautifulSoup(detail_url_text.text,"lxml")
 div_tag = detail_soup.find("div", class_="chapter_content")
 #解析到了講解的內(nèi)容
 content = div_tag.text
 fp.write(title+":"+content+"\n")
 print(title,"爬取成功")

福利消息:

vip音樂獲取源碼:

程序員絕對(duì)不可能花錢系列--Python獲取VIP音樂

當(dāng)然腾供,最后仆邓,只有這幾個(gè)代碼怎么可以,給大家透露一個(gè)福利消息:

我已經(jīng)開始將自己的python相應(yīng)的代碼開源到我的碼云

后面我會(huì)錄制一套視頻包含爬蟲伴鳖,數(shù)據(jù)分析以及辦公自動(dòng)化的相應(yīng)內(nèi)容节值,并且聯(lián)合代碼免費(fèi)分享給大家,大家可以持續(xù)關(guān)注我,到時(shí)候考慮一下是在B站還是直接網(wǎng)盤分享給大家脾猛,供大家學(xué)習(xí)使用娱仔,現(xiàn)在年底了,雖然我們已經(jīng)因?yàn)橐咔橥9せ丶伊四淠耍牵依镆琅f一堆事豌汇,畢竟也有一年沒有回家了幢炸,所以這個(gè)視頻暫定時(shí)間是年后進(jìn)行發(fā)布,現(xiàn)在就委屈想學(xué)習(xí)的大家拒贱,先看著文字學(xué)習(xí)一下吧

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末宛徊,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子逻澳,更是在濱河造成了極大的恐慌闸天,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,126評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件斜做,死亡現(xiàn)場離奇詭異苞氮,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)瓤逼,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門笼吟,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人抛姑,你說我怎么就攤上這事赞厕。” “怎么了定硝?”我有些...
    開封第一講書人閱讀 152,445評(píng)論 0 341
  • 文/不壞的土叔 我叫張陵皿桑,是天一觀的道長。 經(jīng)常有香客問我,道長诲侮,這世上最難降的妖魔是什么镀虐? 我笑而不...
    開封第一講書人閱讀 55,185評(píng)論 1 278
  • 正文 為了忘掉前任,我火速辦了婚禮沟绪,結(jié)果婚禮上刮便,老公的妹妹穿的比我還像新娘。我一直安慰自己绽慈,他們只是感情好恨旱,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,178評(píng)論 5 371
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著坝疼,像睡著了一般搜贤。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上钝凶,一...
    開封第一講書人閱讀 48,970評(píng)論 1 284
  • 那天仪芒,我揣著相機(jī)與錄音,去河邊找鬼耕陷。 笑死掂名,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的哟沫。 我是一名探鬼主播饺蔑,決...
    沈念sama閱讀 38,276評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼嗜诀!你這毒婦竟也來了膀钠?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 36,927評(píng)論 0 259
  • 序言:老撾萬榮一對(duì)情侶失蹤裹虫,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后融击,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體筑公,經(jīng)...
    沈念sama閱讀 43,400評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,883評(píng)論 2 323
  • 正文 我和宋清朗相戀三年尊浪,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了匣屡。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 37,997評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡拇涤,死狀恐怖捣作,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情鹅士,我是刑警寧澤券躁,帶...
    沈念sama閱讀 33,646評(píng)論 4 322
  • 正文 年R本政府宣布,位于F島的核電站,受9級(jí)特大地震影響也拜,放射性物質(zhì)發(fā)生泄漏以舒。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,213評(píng)論 3 307
  • 文/蒙蒙 一慢哈、第九天 我趴在偏房一處隱蔽的房頂上張望蔓钟。 院中可真熱鬧,春花似錦卵贱、人聲如沸滥沫。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,204評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽兰绣。三九已至,卻和暖如春方妖,著一層夾襖步出監(jiān)牢的瞬間狭魂,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,423評(píng)論 1 260
  • 我被黑心中介騙來泰國打工党觅, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留雌澄,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,423評(píng)論 2 352
  • 正文 我出身青樓杯瞻,卻偏偏與公主長得像镐牺,于是被迫代替她去往敵國和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子魁莉,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,722評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容