selenium庫(kù)的基本使用

什么是selenium

selenium 是一個(gè)用于Web應(yīng)用程序測(cè)試的工具创坞。Selenium測(cè)試直接運(yùn)行在瀏覽器中魄鸦,就像真正的用戶(hù)在操作一樣褪秀。支持的瀏覽器包括IE(7, 8, 9, 10, 11),Mozilla Firefox就漾,Safari矿微,Google Chrome痕慢,Opera等。selenium 是一套完整的web應(yīng)用程序測(cè)試系統(tǒng)涌矢,包含了測(cè)試的錄制(selenium IDE),編寫(xiě)及運(yùn)行(Selenium Remote Control)和測(cè)試的并行處理(Selenium Grid)掖举。
Selenium的核心Selenium Core基于JsUnit,完全由JavaScript編寫(xiě)娜庇,因此可以用于任何支持JavaScript的瀏覽器上拇泛。
selenium可以模擬真實(shí)瀏覽器滨巴,自動(dòng)化測(cè)試工具,支持多種瀏覽器俺叭,爬蟲(chóng)中主要用來(lái)解決JavaScript渲染問(wèn)題。
這里要說(shuō)一下比較重要的PhantomJS,PhantomJS是一個(gè)而基于WebKit的服務(wù)端JavaScript API,支持Web而不需要瀏覽器支持泰偿,其快速熄守、原生支持各種Web標(biāo)準(zhǔn):Dom處理,CSS選擇器耗跛,JSON等等裕照。PhantomJS可以用用于頁(yè)面自動(dòng)化、網(wǎng)絡(luò)監(jiān)測(cè)调塌、網(wǎng)頁(yè)截屏晋南,以及無(wú)界面測(cè)試

selenium的基本用法

聲明瀏覽器對(duì)象
上面我們知道了selenium支持很多的瀏覽器:

但是如果想要聲明并調(diào)用瀏覽器則需要:

from selenium import webdriver

browser = webdriver.Chrome()
browser = webdriver.Firefox()

這里只寫(xiě)了兩個(gè)例子,當(dāng)然了其他的支持的瀏覽器都可以通過(guò)這種方式調(diào)用
訪問(wèn)頁(yè)面

from selenium import webdriver#導(dǎo)入庫(kù)
browser = webdriver.Chrome()#聲明瀏覽器
url = 'https:www.baidu.com'
browser.get(url)#打開(kāi)瀏覽器預(yù)設(shè)網(wǎng)址
print(browser.page_source)#打印網(wǎng)頁(yè)源代碼
browser.close()#關(guān)閉瀏覽器

上述代碼運(yùn)行后羔砾,會(huì)自動(dòng)打開(kāi)Chrome瀏覽器负间,并登陸百度打印百度首頁(yè)的源代碼,然后關(guān)閉瀏覽器

查找元素

單個(gè)元素查找

from selenium import webdriver#導(dǎo)入庫(kù)
browser = webdriver.Chrome()#聲明瀏覽器
url = 'https:www.taobao.com'
browser.get(url)#打開(kāi)瀏覽器預(yù)設(shè)網(wǎng)址
input_first = browser.find_element_by_id('q')
input_two = browser.find_element_by_css_selector('#q')
print(input_first)
print(input_two)

這里我們通過(guò)2種不同的方式去獲取響應(yīng)的元素姜凄,第一種是通過(guò)id的方式政溃,第二個(gè)中是CSS選擇器,結(jié)果都是相同的态秧。
輸出如下:

<selenium.webdriver.remote.webelement.WebElement (session="9aaa01da6545ba2013cc432bcb9abfda", element="0.5325244323105505-1")>
<selenium.webdriver.remote.webelement.WebElement (session="9aaa01da6545ba2013cc432bcb9abfda", element="0.5325244323105505-1")>

這里列舉一下常用的查找元素方法:
find_element_by_name
find_element_by_id
find_element_by_xpath
find_element_by_link_text
find_element_by_partial_link_text
find_element_by_tag_name
find_element_by_class_name
find_element_by_css_selector
下面這種方式是比較通用的一種方式:這里需要記住By模塊所以需要導(dǎo)入
from selenium.webdriver.common.by import By

from selenium import webdriver
from selenium.webdriver.common.by import By

browser = webdriver.Chrome()
url = 'https://www.taobao.com'
browser.get(url)
input_1 = browser.find_element(By.ID, 'q')
print(input_1)

當(dāng)然這種方法和上述的方式是通用的董虱,browser.find_element(By.ID,"q")這里By.ID中的ID可以替換為其他幾個(gè)
我個(gè)人比較傾向于css
多個(gè)元素查找
其實(shí)多個(gè)元素和單個(gè)元素的區(qū)別,舉個(gè)例子:find_elements,單個(gè)元素是find_element,其他使用上沒(méi)什么區(qū)別申鱼,通過(guò)其中的一個(gè)例子演示:

from selenium import webdriver

browser = webdriver.Chrome()
url = 'https://www.taobao.com'
browser.get(url)
input = browser.find_elements_by_css_selector('.service-bd li')
print(input)
browser.close()

輸出為一個(gè)列表形式:

[<selenium.webdriver.remote.webelement.WebElement (session="42d192ca36f75170ab489e4839df0980", element="0.73211490098068-1")>, <selenium.webdriver.remote.webelement.WebElement (session="42d192ca36f75170ab489e4839df0980", element="0.73211490098068-2")>, <selenium.webdriver.remote.webelement.WebElement (session="42d192ca36f75170ab489e4839df0980", element="0.73211490098068-3")>, <selenium.webdriver.remote.webelement.WebElement (session="42d192ca36f75170ab489e4839df0980", element="0.73211490098068-4")>, <selenium.webdriver.remote.webelement.WebElement (session="42d192ca36f75170ab489e4839df0980", element="0.73211490098068-5")>, <selenium.webdriver.remote.webelement.WebElement (session="42d192ca36f75170ab489e4839df0980", element="0.73211490098068-6")>, <selenium.webdriver.remote.webelement.WebElement (session="42d192ca36f75170ab489e4839df0980", element="0.73211490098068-7")>, <selenium.webdriver.remote.webelement.WebElement (session="42d192ca36f75170ab489e4839df0980", element="0.73211490098068-8")>, <selenium.webdriver.remote.webelement.WebElement (session="42d192ca36f75170ab489e4839df0980", element="0.73211490098068-9")>, <selenium.webdriver.remote.webelement.WebElement (session="42d192ca36f75170ab489e4839df0980", element="0.73211490098068-10")>, <selenium.webdriver.remote.webelement.WebElement (session="42d192ca36f75170ab489e4839df0980", element="0.73211490098068-11")>, <selenium.webdriver.remote.webelement.WebElement (session="42d192ca36f75170ab489e4839df0980", element="0.73211490098068-12")>, <selenium.webdriver.remote.webelement.WebElement (session="42d192ca36f75170ab489e4839df0980", element="0.73211490098068-13")>, <selenium.webdriver.remote.webelement.WebElement (session="42d192ca36f75170ab489e4839df0980", element="0.73211490098068-14")>, <selenium.webdriver.remote.webelement.WebElement (session="42d192ca36f75170ab489e4839df0980", element="0.73211490098068-15")>, <selenium.webdriver.remote.webelement.WebElement (session="42d192ca36f75170ab489e4839df0980", element="0.73211490098068-16")>]

當(dāng)然上面的方式也是可以通過(guò)導(dǎo)入from selenium.webdriver.common.by import By 這種方式實(shí)現(xiàn)
lis = browser.find_elements(By.CSS_SELECTOR,'.service-bd li')
同樣的在單個(gè)元素中查找的方法在多個(gè)元素查找中同樣存在:
find_elements_by_name
find_elements_by_id
find_elements_by_xpath
find_elements_by_link_text
find_elements_by_partial_link_text
find_elements_by_tag_name
find_elements_by_class_name
find_elements_by_css_selector
元素交互操作
對(duì)于獲取的元素調(diào)用交互方法

from selenium import webdriver
import time
browser = webdriver.Chrome()
browser.get(url='https://www.baidu.com')
time.sleep(2)
input = browser.find_element_by_css_selector('#kw')
input.send_keys('韓國(guó)女團(tuán)')
time.sleep(2)
input.clear()
input.send_keys('后背搖')
button = browser.find_element_by_css_selector('#su')
button.click()
time.sleep(10)
browser.close()

運(yùn)行的結(jié)果可以看出程序會(huì)自動(dòng)打開(kāi)Chrome瀏覽器并打開(kāi)百度頁(yè)面輸入韓國(guó)女團(tuán),然后刪除愤诱,重新輸入后背搖,并點(diǎn)擊搜索
Selenium所有的api文檔:http://selenium-python.readthedocs.io/api.html#module-selenium.webdriver.common.action_chains
交互動(dòng)作
將動(dòng)作附加到動(dòng)作鏈中串行執(zhí)行

from selenium import webdriver
from selenium.webdriver import ActionChains

browser = webdriver.Chrome()

url = "http://www.runoob.com/try/try.php?filename=jqueryui-api-droppable"
browser.get(url)
browser.switch_to.frame('iframeResult')
source = browser.find_element_by_css_selector('#draggable')
target = browser.find_element_by_css_selector('#droppable')
actions = ActionChains(browser)
actions.drag_and_drop(source, target)
actions.perform()

更多操作參考:http://selenium-python.readthedocs.io/api.html#module-selenium.webdriver.common.action_chains
執(zhí)行JavaScript
這是一個(gè)非常有用的方法捐友,這里就可以直接調(diào)用js方法來(lái)實(shí)現(xiàn)一些操作淫半,
下面的例子是通過(guò)登錄知乎然后通過(guò)js翻到頁(yè)面底部,并彈框提示

from selenium import webdriver
browser = webdriver.Chrome()
browser.get("http://www.zhihu.com/explore")
browser.execute_script('window.scrollTo(0,document.body.scrollHeight)')
browser.execute_script('alert("To Bottom")')


獲取元素屬性
get_attribute('class')

from selenium import webdriver
import time
browser = webdriver.Chrome()
browser.get("http://www.zhihu.com/explore")
logo = browser.find_element_by_css_selector('.zu-top-link-logo')
print(logo)
print(logo.get_attribute('class'))
print(logo.get_attribute('id'))
time.sleep(2)
browser.quit()

輸出如下:

<selenium.webdriver.remote.webelement.WebElement (session="b72dbd6906debbca7d0b49ab6e064d92", element="0.511689875475734-1")>
zu-top-link-logo
zh-top-link-logo

獲取文本值
text

from selenium import webdriver
browser = webdriver.Chrome()
browser.get("http://www.zhihu.com/explore")
logo = browser.find_element_by_css_selector('.zu-top-link-logo')
print(logo)
print(logo.text)

輸出如下:

<selenium.webdriver.remote.webelement.WebElement (session="ce8814d69f8e1291c88ce6f76b6050a2", element="0.9868611170776878-1")>
知乎

獲取ID楚殿,位置撮慨,標(biāo)簽名
id
location
tag_name
size

from selenium import webdriver

browser = webdriver.Chrome()
url = 'https://www.zhihu.com/explore'
browser.get(url)
input = browser.find_element_by_css_selector('.zu-top-add-question')
print(input.id)
print(input.location)
print(input.tag_name)
print(input.size)

輸出如下:

0.022998219885927318-1
{'x': 759, 'y': 7}
button
{'height': 32, 'width': 66}
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市脆粥,隨后出現(xiàn)的幾起案子砌溺,更是在濱河造成了極大的恐慌,老刑警劉巖变隔,帶你破解...
    沈念sama閱讀 218,755評(píng)論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件规伐,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡匣缘,警方通過(guò)查閱死者的電腦和手機(jī)猖闪,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,305評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門(mén)鲜棠,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人培慌,你說(shuō)我怎么就攤上這事豁陆。” “怎么了吵护?”我有些...
    開(kāi)封第一講書(shū)人閱讀 165,138評(píng)論 0 355
  • 文/不壞的土叔 我叫張陵盒音,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我馅而,道長(zhǎng)祥诽,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,791評(píng)論 1 295
  • 正文 為了忘掉前任瓮恭,我火速辦了婚禮雄坪,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘屯蹦。我一直安慰自己维哈,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,794評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布颇玷。 她就那樣靜靜地躺著笨农,像睡著了一般。 火紅的嫁衣襯著肌膚如雪帖渠。 梳的紋絲不亂的頭發(fā)上谒亦,一...
    開(kāi)封第一講書(shū)人閱讀 51,631評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音空郊,去河邊找鬼份招。 笑死,一個(gè)胖子當(dāng)著我的面吹牛狞甚,可吹牛的內(nèi)容都是我干的锁摔。 我是一名探鬼主播,決...
    沈念sama閱讀 40,362評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼哼审,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼谐腰!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起涩盾,我...
    開(kāi)封第一講書(shū)人閱讀 39,264評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤十气,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后春霍,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體砸西,經(jīng)...
    沈念sama閱讀 45,724評(píng)論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,900評(píng)論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了芹枷。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片衅疙。...
    茶點(diǎn)故事閱讀 40,040評(píng)論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖鸳慈,靈堂內(nèi)的尸體忽然破棺而出饱溢,到底是詐尸還是另有隱情,我是刑警寧澤蝶涩,帶...
    沈念sama閱讀 35,742評(píng)論 5 346
  • 正文 年R本政府宣布理朋,位于F島的核電站,受9級(jí)特大地震影響绿聘,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜次舌,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,364評(píng)論 3 330
  • 文/蒙蒙 一熄攘、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧彼念,春花似錦挪圾、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,944評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至吩案,卻和暖如春棚赔,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背徘郭。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,060評(píng)論 1 270
  • 我被黑心中介騙來(lái)泰國(guó)打工靠益, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人残揉。 一個(gè)月前我還...
    沈念sama閱讀 48,247評(píng)論 3 371
  • 正文 我出身青樓胧后,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親抱环。 傳聞我的和親對(duì)象是個(gè)殘疾皇子壳快,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,979評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容