在遍历网站表格时,如果表格元素尚未附加到页面文档中,可以使用以下代码示例解决:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
# 实例化浏览器驱动
driver = webdriver.Chrome()
# 打开网页
driver.get("https://example.com")
# 等待表格元素加载完成
table = WebDriverWait(driver, 10).until(
EC.presence_of_element_located((By.XPATH, "//table[@id='table_id']"))
)
# 遍历表格行
rows = table.find_elements(By.TAG_NAME, "tr")
for row in rows:
# 遍历表格列
columns = row.find_elements(By.TAG_NAME, "td")
for column in columns:
# 输出单元格内容
print(column.text)
# 关闭浏览器驱动
driver.quit()
在上述代码中,我们使用了WebDriverWait
来等待表格元素加载完成。WebDriverWait
会在指定的时间内等待,直到表格元素出现在页面中。
然后,我们使用find_elements
方法来找到表格行和列。通过嵌套的循环,我们可以遍历表格中的每个单元格,并输出其内容。
最后,记得在使用完浏览器驱动后,调用quit()
方法来关闭浏览器。
上一篇:遍历网页并下载PDF文件