功能社证、效果說(shuō)明
之前就有考慮過(guò)做一個(gè)小紅書(shū)單個(gè)筆記的數(shù)據(jù)采集的功能。
筆記頁(yè)面有圖片评凝、標(biāo)題追葡、描述信息、評(píng)論奕短。
如若存在其他信息:地點(diǎn)宜肉、話題、艾特用戶(hù)等翎碑。后續(xù)也會(huì)將此類(lèi)信息歸納整理谬返。
這個(gè)功能完整版包含了
- 采集下載所有圖片到指定目錄。
- 筆記描述保存成文本數(shù)據(jù)文件日杈。
- 評(píng)論單獨(dú)保存為一個(gè)文本數(shù)據(jù)文件遣铝。
效果演示
請(qǐng)求筆記詳情頁(yè)的接口可以獲得以下數(shù)據(jù)。
寫(xiě)入到csv文件的數(shù)據(jù)結(jié)構(gòu)大概如下圖所示达椰。
實(shí)現(xiàn)思路
先前有做過(guò)小紅書(shū)關(guān)鍵詞采集功能翰蠢。
在那個(gè)功能中,我可以獲得筆記基礎(chǔ)信息啰劲。
在采集結(jié)果文件中有筆記的id
梁沧。
我們只需要把id
加上url
前綴,就可以拿到指定筆記頁(yè)面主要的數(shù)據(jù)蝇裤。
再借助程序廷支,采集該頁(yè)面的數(shù)據(jù)即可。
實(shí)現(xiàn)代碼
以下是獲取筆記數(shù)據(jù)并寫(xiě)入csv文件的相關(guān)代碼。
實(shí)現(xiàn)原理
用request
模擬get
請(qǐng)求小紅書(shū)微信端的筆記詳情接口。
就可以拿到所有的筆記詳情頁(yè)的基礎(chǔ)數(shù)據(jù)陆馁。
用csv簡(jiǎn)單處理數(shù)據(jù)徘公,將所有數(shù)據(jù)寫(xiě)入到csv
文件中。
這個(gè)保存了筆記詳情頁(yè)數(shù)據(jù)的文件可以用于后續(xù)完整功能的編寫(xiě)驹溃。
總結(jié)與拓展
采集單個(gè)小紅書(shū)筆記有助于我們對(duì)高贊高質(zhì)量筆記進(jìn)行內(nèi)容分析舱殿。
對(duì)于內(nèi)容運(yùn)營(yíng)者的我們饲宛,可以學(xué)習(xí)他們優(yōu)秀的地方僵娃。
只有知己知彼方能百戰(zhàn)不殆概作。
希望這個(gè)點(diǎn)子能幫助你我創(chuàng)作出更優(yōu)質(zhì)的小紅書(shū)筆記。