selenium文檔中關(guān)于等待第5章有專門的說明
現(xiàn)在的大多數(shù)的Web應(yīng)用程序是使用Ajax技術(shù)泌神。當(dāng)一個(gè)頁面被加載到瀏覽器時(shí), 該頁面內(nèi)的元素可以在不同的時(shí)間點(diǎn)被加載。這使得定位元素變得困難, 如果元素不再頁面之中,會拋出 ElementNotVisibleException 異常尔觉。 使用 waits, 我們可以解決這個(gè)問題。waits提供了一些操作之間的時(shí)間間隔- 主要是定位元素或針對該元素的任何其他操作芥吟。
Selenium Webdriver 提供兩種類型的waits - 隱式和顯式穷娱。 顯式等待會讓W(xué)ebDriver等待滿足一定的條件以后再進(jìn)一步的執(zhí)行。 而隱式等待讓W(xué)ebdriver等待一定的時(shí)間后再才是查找某元素运沦。
顯式等待:
顯式等待是你在代碼中定義等待一定條件發(fā)生后再進(jìn)一步執(zhí)行你的代碼泵额。 最糟糕的案例是使用time.sleep(),它將條件設(shè)置為等待一個(gè)確切的時(shí)間段携添。 這里有一些方便的方法讓你只等待需要的時(shí)間嫁盲。WebDriverWait結(jié)合ExpectedCondition 是實(shí)現(xiàn)的一種方式。
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
driver = webdriver.Firefox()
driver.get("http://somedomain/url_that_delays_loading")
try:
element = WebDriverWait(driver, 10).until(
EC.presence_of_element_located((By.ID, "myDynamicElement"))
)
finally:
driver.quit()
WebDriverWait(driver, 10)設(shè)置了一個(gè)10秒上限的等待時(shí)間
自動化的Web瀏覽器中一些常用的預(yù)期條件烈掠,下面列出的是每一個(gè)實(shí)現(xiàn)羞秤, Selenium Python binding都提供了一些方便的方法,這樣你就不用去編寫 expected_condition類或是創(chuàng)建至今的工具包去實(shí)現(xiàn)他們左敌。傳入的參數(shù)都是元組類型的locator瘾蛋,如(By.ID, 'kw')
expected_conditions as EC后面最最常接的預(yù)期條件:
#frame可見并切換到該frame上
EC.frame_to_be_available_and_switch_to_it
#元素可以點(diǎn)擊,常用于按鍵
EC.element_to_be_clickable
#元素出現(xiàn)矫限,只要一個(gè)符合條件的元素加載出來就通過
EC.presence_of_element_located
#元素出現(xiàn)哺哼,須所有符合條件的元素都加載出來,這個(gè)基本上就是你爬取的最主要內(nèi)容了
EC.presence_of_all_elements_located
#判斷某段文本是否出現(xiàn)在某元素中叼风,常用于判斷輸入頁數(shù)與實(shí)際高亮頁數(shù)是否一致
EC.text_to_be_present_in_element
By后面常接的選擇方式(未列出全部取董,全部請dir(By)查看):
By.CLASS_NAME #根據(jù)class的名稱
By.ID #根據(jù)id的名稱
By.TAG_NAME #根據(jù)標(biāo)簽的名稱
#最最無敵的兩個(gè),直接從開發(fā)者工具中就可以無腦用css或xpath方法復(fù)制元素的位置
By.CSS_SELECTOR #應(yīng)用CSS選擇器方法
By.XPATH #應(yīng)用XPATH選擇器方法
以上一篇文章的登錄QQ空間為例无宿,我們用顯式等待修改下代碼:
from selenium import webdriver
#為了增加顯式等待茵汰,增加以下三個(gè)模塊
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
url = 'http://user.qzone.qq.com/'
driver = webdriver.Chrome()
driver.get(url)
#設(shè)置等待上限10秒
timeout = WebDriverWait(driver, 10)
#切換到登錄框中的frame
timeout.until(EC.frame_to_be_available_and_switch_to_it((By.ID, 'login_frame')))
switcher_plogin = timeout.until(EC.element_to_be_clickable((By.ID, 'switcher_plogin')))
#點(diǎn)擊“帳號密碼登錄”按鈕
switcher_plogin.click()
#定位帳號輸入框
username = timeout.until(EC.presence_of_element_located((By.ID, 'u')))
#username = driver.find_element_by_id('u')
#清空帳號輸入框內(nèi)容
username.clear()
#填寫帳號
username.send_keys('你的賬號')
password = timeout.until(EC.presence_of_element_located((By.ID, 'p')))
#password = driver.find_element_by_id('p')
password.clear()
password.send_keys('你的密碼')
#點(diǎn)擊“登錄”按鈕
log_in = timeout.until(EC.element_to_be_clickable((By.ID, 'login_button'))).click()
#driver.quit()
還可以用username.text獲得標(biāo)簽中的文字信息。
隱式等待
如果某些元素不是立即可用的孽鸡,隱式等待是告訴WebDriver去等待一定的時(shí)間后去查找元素蹂午。 默認(rèn)等待時(shí)間是0秒栏豺,一旦設(shè)置該值,隱式等待是設(shè)置該WebDriver的實(shí)例的生命周期豆胸。
from selenium import webdriver
driver = webdriver.Firefox()
driver.implicitly_wait(10) # seconds
driver.get("http://somedomain/url_that_delays_loading")
myDynamicElement = driver.find_element_by_id("myDynamicElement")