BeautifulSoup对于某些网站仅返回部分链接的问题。 _程序开发

BeautifulSoup对于某些网站仅返回部分链接的问题。

创始人

2024-11-27 13:30:13

0次

使用 urlparse 模块对链接进行补全。

示例代码：

from urllib.parse import urlparse

import requests
from bs4 import BeautifulSoup

url = 'http://example.com'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
links = soup.find_all('a')

for link in links:
    href = link.get('href')
    if href:
        parsed_url = urlparse(href, scheme='http', allow_fragments=False)
        if not parsed_url.netloc:
            parsed_url = parsed_url._replace(netloc=urlparse(url).netloc)
            link['href'] = parsed_url.geturl()

print(soup)

这里的做法是使用 urlparse 解析链接，并补全缺失的部分。如果链接不包含主机名，则使用原始链接的主机名进行补全。最后，将链接赋回原始元素的 href 属性。

上一篇：BeautifulSoup对于<a>标签返回一些奇怪的文本。

下一篇：BeautifulSoup方法

热门资讯

6分钟辅助！hhpoker是真... 6分钟辅助！hhpoker是真的假的，hhpoker真的有透视吗，演示教程（真是有挂）1、每一步都需...

第七分钟辅助！we poker... 第七分钟辅助！we poker插件，we poker免费辅助器，手筋教程（有挂方式）暗藏猫腻，小编详...

七分钟辅助！aa poker辅... 七分钟辅助！aa poker辅助包，pokemmo脚本辅助器下载，讲义教程（有挂秘籍）1、pokem...

第四分钟辅助！wepoker辅... 第四分钟辅助！wepoker辅助器安装包定制，aapoker透视脚本，大纲教程（有挂总结）所有人都在...

第四分钟辅助！wpk透视辅助靠... 第四分钟辅助！wpk透视辅助靠谱吗，wepoker透视苹果系统，诀窍教程（有挂猫腻）；运wepoke...

七分钟辅助！aapoker透视... 七分钟辅助！aapoker透视脚本入口，wejoker开挂，学习教程（有挂教程）1、打开软件启动之后...

第四分钟辅助！淘宝买wepok... 第四分钟辅助！淘宝买wepoker透视有用吗，wpk俱乐部怎么作弊，积累教程（有挂规律）1、下载好淘...

6分钟辅助！we-poker软... 6分钟辅助！we-poker软件，购买的wpk辅助在哪里下载，积累教程（有挂技巧）购买的wpk辅助在...

第2分钟辅助！如何下载wepo... 第2分钟辅助！如何下载wepoker安装包，newpoker怎么安装脚本，教程书教程（今日头条）1、...

4分钟辅助！wepoker钻石... 4分钟辅助！wepoker钻石怎么看底牌，wepoker辅助器有哪些功能，法门教程（有挂详细）该软件...

BeautifulSoup对于某些网站仅返回部分链接的问题。

相关内容

热门资讯