要解决Beautiful Soup不会跳转到下一页的问题,你可以使用其他库来处理网页的跳转,例如requests和urllib库。下面是一个示例代码,演示如何使用requests和Beautiful Soup来处理网页跳转:
import requests
from bs4 import BeautifulSoup
url = 'https://example.com/page1' # 第一页的URL
while url:
response = requests.get(url)
soup = BeautifulSoup(response.content, 'html.parser')
# 处理当前页面的内容
# ...
# 获取下一页的URL
next_link = soup.find('a', {'class': 'next'})
if next_link:
url = next_link['href']
else:
url = None
在上面的示例中,首先定义了一个初始的URL(第一页的URL)。然后,使用requests库发送GET请求来获取网页的内容。接下来,使用Beautiful Soup解析网页内容,并处理当前页面的内容。在获取下一页的URL时,可以使用Beautiful Soup的find方法来查找包含下一页链接的HTML元素。如果找到下一页链接,将其赋值给变量url,然后进入下一次循环。如果没有找到下一页链接,将url设置为None,结束循环。
通过这种方式,你可以使用requests和Beautiful Soup来处理网页跳转,并在循环中处理每一页的内容。请根据你的具体需求和网页结构进行适当的修改。