企業(yè)網(wǎng)站設(shè)計使用selenium自動獲取頁面爬取
日期 : 2020-09-30 15:35:35
使用selenium自動獲取頁面爬取
(1)使用webdriver庫,模擬人工進入網(wǎng)頁。
(2)依次點擊正常登陸時需要點擊的對話框。
(3)elenium是在模仿人工點擊頁面,因此人工正常瀏覽網(wǎng)站時,該有的步驟都不能少,否則就會卡住在這步,從而導(dǎo)致程序異常中止。
(4)這里通過使用webdrive庫的find_element_by_xpath和find_element_by_css_selector兩個用法,找到每個點擊框的位置并用click()點擊。
(5)登陸賬號
由于網(wǎng)站需要登錄才能進行詳細信息的查看,因此先要進行登錄操作,再進行后續(xù)的檢索。同樣是先使用find_element_by_css_selector用法找到登錄框和輸入賬號密碼的位置,在用send_keys用法分別輸入賬號和密碼,最后在點擊登錄框中的登錄。
(1)使用webdriver庫,模擬人工進入網(wǎng)頁。
(2)依次點擊正常登陸時需要點擊的對話框。
(3)elenium是在模仿人工點擊頁面,因此人工正常瀏覽網(wǎng)站時,該有的步驟都不能少,否則就會卡住在這步,從而導(dǎo)致程序異常中止。
(4)這里通過使用webdrive庫的find_element_by_xpath和find_element_by_css_selector兩個用法,找到每個點擊框的位置并用click()點擊。
(5)登陸賬號
由于網(wǎng)站需要登錄才能進行詳細信息的查看,因此先要進行登錄操作,再進行后續(xù)的檢索。同樣是先使用find_element_by_css_selector用法找到登錄框和輸入賬號密碼的位置,在用send_keys用法分別輸入賬號和密碼,最后在點擊登錄框中的登錄。