一棺亭、簡介
? ? ? ? ? 一款開源?的HTML解析器,可直接解析某個URL地址蟋软、HTML文本內(nèi)容镶摘。它提供了一套非常省力的API嗽桩,可通過DOM,CSS以及類似于jQuery的操作方法來取出和操作數(shù)據(jù)凄敢÷狄保可以爬取網(wǎng)頁內(nèi)容并提取數(shù)據(jù),中文網(wǎng)站點這里?涝缝,官網(wǎng)點這里?扑庞。
二、使用(android studio)
1拒逮、在module下添加庫依賴
compile'org.jsoup:jsoup:1.10.2'
2罐氨、代碼中使用的三種方式
a、直接解析HTML
(1)滩援、Jsoup.parse()解析HTML.
(2)栅隐、獲得Document對象
(3)、通過JS相關(guān)Api解析HTML文檔玩徊,或者通過Jsoup的選擇器解析文檔
b约啊、請求url并解析HTML
(1)、定義URL
(2)佣赖、請求網(wǎng)絡(luò)Jsoup.connect()
(3)恰矩、解析HTML,步驟為a方式的(2)、(3)兩個步驟憎蛤。
c外傅、加載文件(本地)并解析HTML
(1)、定義文件位置
(2)俩檬、加載文件Jsoup.parse(File in, String charsetName, String baseUri).
(3)萎胰、解析HTML步驟為a方式的(2)、(3)兩個步驟棚辽。