Python自動化可以實現(xiàn)一些常見的功能碍庵,如刷短視頻映企、贊藏評悟狱、直播間發(fā)消息彈幕、指定時間給某人發(fā)祝福信息堰氓、不同人發(fā)不同消息和采集界面上的數(shù)據(jù)等挤渐,高效的實現(xiàn)批量和定時操作。網紅的數(shù)據(jù)有些就是通過自動化程序模擬人工方式刷的双絮,操作越接近人工越不會被平臺封禁浴麻,盡量不要用sleep(1)、sleep(3)這種整數(shù)時間的等待囤攀,一看就是機器软免。
程序實現(xiàn)思路
1、安裝和配置Appium焚挠、DrissionPage膏萧、Python和相關的庫
2、自動定位和操作界面元素
3蝌衔、自動定位頁面元素提取數(shù)據(jù)
4榛泛、循環(huán)刷新獲取數(shù)據(jù)
5、數(shù)據(jù)去重排序保存到Excel或各種數(shù)據(jù)庫
自動化環(huán)境安裝
DrissionPage 4.0.4.8
Appium-Python-Client 2.0.0
selenium 4.0.0
注意各庫之間版本兼容
效果演示
圖片.png
圖片.png
圖片.png
總結
內容采集需要遵守相關法律法規(guī)和網站的使用條款噩斟。
Web端采集數(shù)據(jù)已經有成熟的工具如八爪魚等曹锨,移動端還沒發(fā)現(xiàn)類似工具,實現(xiàn)起來底層原理是一樣的亩冬。
以上都是些采集數(shù)據(jù)基本入門知識艘希,對這方面感興趣看下就會。更進一步可以研究以下技術點
攔截Ajax請求
代碼注入
逆向請求參數(shù)加密算法
各種驗證碼自動識別
逆向App硅急、脫殼覆享、修改so函數(shù)