Selector:
位置scrapy根目錄下的selector文件中的unified(統(tǒng)一的).py中汰瘫,
記得在裝Scrapy之前會(huì)裝許多依賴包紊撕,Selector繼承了parsel文件下的selector.py中的Selector類
>>>def __init__(self, response=None, text=None, type=None, root=None, _root=None, **kwargs):
基本使用:
>>>Selector(response=response).xpath('? ')#.xpath()及.css()方法返回一個(gè)類SelectorList的實(shí)例, 它是一個(gè)新選擇器的列表。這個(gè)API可以用來快速的提取嵌套數(shù)據(jù)酥泛。
為了提取真實(shí)的原文數(shù)據(jù)嘉裤,你需要調(diào)用.extract()方法如下:
>>> response.xpath('//title/text()').extract()
[u'Example website']
于在response中使用XPath、CSS查詢十分普遍熙涤,因此,Scrapy提供了兩個(gè)實(shí)用的快捷方式:response.xpath()及response.css()