3 獲取文章標(biāo)題清單
3 1 查看頁(yè)面元素
參考百度經(jīng)驗(yàn)safari如何查看網(wǎng)頁(yè)源碼對(duì)瀏覽器進(jìn)行設(shè)置培慌。
設(shè)置完后可以看到每篇文章的位置徘跪。
3 2 在頁(yè)面中選取需要的元素
參考jsoup幫助森书,按類進(jìn)行選擇
根據(jù)網(wǎng)頁(yè)源碼整理選取思路
選取的思路是先找到 class 為 excerpt 的 article 衅码,然后再找 header境输,然后再找 h2 喇伯,然后再找 a 痘煤。
可以獲取到列表,但結(jié)果需要優(yōu)化
參考進(jìn)行改進(jìn)
改進(jìn)后結(jié)果
改進(jìn)后的選擇語(yǔ)句