以下是一个使用Apify爬虫的简单示例,其中有两个可点击的元素。该爬虫将访问一个网站,并点击页面上的两个按钮。
import requests
from apify import ApifyCrawler
class MyCrawler(ApifyCrawler):
def handle_page_loaded(self, page):
# 在页面加载完成后,点击第一个按钮
page.click('button#button1')
page.wait_for_navigation()
# 在页面加载完成后,点击第二个按钮
page.click('button#button2')
page.wait_for_navigation()
# 在控制台输出页面的HTML内容
print(page.content)
# 停止爬虫
self.stop()
# 创建一个爬虫实例,并设置起始URL
crawler = MyCrawler(start_urls=['https://example.com'])
# 运行爬虫
crawler.run()
在上面的示例中,我们创建了一个自定义的ApifyCrawler类,并重写了handle_page_loaded方法。在这个方法中,我们使用page.click()来点击页面上的两个按钮,并使用page.wait_for_navigation()来等待页面加载完成。
最后,我们在控制台输出页面的HTML内容,并调用self.stop()来停止爬虫。