信息采集
需要登錄 cookies+jsoup
不需要登錄 cookies
cookies來源
通過webview獲取
jsoup使用
爬取規(guī)則
標簽內部屬性爬取 例如 <a class="test" type="v"> 目的:爬取type
標簽直接爬取 例如<a>文字</a> 目的:爬取文字
標簽內到標簽內 例如 <a>我是文字<br>干擾信息文字</a> 目的:爬取我是文字
爬取數(shù)量統(tǒng)計
size()函數(shù)
1)、Android Studio使用已經(jīng)順手恩够,alt+enter是一個很不錯的選擇
2)惊科、解決的難點問題
1异剥、使用webview登錄后獲取cookies焚志,利用cookies再通過jsoup自動登錄采集信息
ps:還可以通過chrome瀏覽器F12開發(fā)人員工具直接讀取cookies
2、Jsoup抓取相關的問題
抓取一個標簽內部的屬性值方法:
attr[shuxing]
統(tǒng)計item個數(shù):
size()函數(shù)