BeautifulSoup的find_all('href')只返回了值的一部分。
创始人
2024-11-27 12:30:22
0

BeautifulSoup的find_all('href')方法返回的是标签中所有包含href属性的元素,而不是值的一部分。如果你只想获取href属性的值的一部分,可以使用正则表达式来提取所需的部分。

以下是一个示例代码,演示如何使用正则表达式来提取href属性值的一部分:

import re
from bs4 import BeautifulSoup

html = '''
Link 1
Link 2
Link 3
'''

soup = BeautifulSoup(html, 'html.parser')

links = soup.find_all('a')
for link in links:
    href = link.get('href')
    # 使用正则表达式提取href属性值的一部分
    match = re.search(r'https://example.com/(.+)', href)
    if match:
        partial_value = match.group(1)
        print(partial_value)

在上面的代码中,我们使用正则表达式r'https://example.com/(.+)来匹配https://example.com/后面的任意字符,并使用match.group(1)来获得匹配的部分。

运行上面的代码将输出:

page1
page2
page3

这样你就可以根据自己的需求提取href属性值的一部分。

相关内容

热门资讯

线上(wepoke真的)原来是... 线上(wepoke真的)原来是真的有挂!其实真的有挂(2022已更新)(哔哩哔哩);亲,其实确实真的...
两教程(Wepoke程序)软件... 两教程(Wepoke程序)软件透明挂辅助工具(软件透明挂)透视辅助(2024已更新)(哔哩哔哩);致...
软件(wepoke透明)原来是... 软件(wepoke透明)原来是真的有挂!其实真的有挂(2020已更新)(哔哩哔哩)是一款可以让一直输...
一模拟器(德扑工具)外挂辅助工... 一模拟器(德扑工具)外挂辅助工具(透视)透视辅助(2025已更新)(哔哩哔哩);亲真的是有正版授权,...
系统(aapoker讲解)竟然... 系统(aapoker讲解)竟然真的有挂!其实真的有挂(2021已更新)(哔哩哔哩);aapoker讲...
6系统(aapoker下载)外... 6系统(aapoker下载)外挂辅助工具(辅助挂)透视辅助(2023已更新)(哔哩哔哩)aapoke...
智能(德扑之星刷数据)果真真的... 智能(德扑之星刷数据)果真真的有挂!原来真的有挂(2025已更新)(哔哩哔哩);《WPK辅助透视》‌...
1机器人(德州nzt软件)软件... 1机器人(德州nzt软件)软件透明挂辅助软件(透视)透视辅助(2022已更新)(哔哩哔哩);人气非常...
ai代打(德扑之星决策)确实是... ai代打(德扑之星决策)确实是真的有挂!原来真的有挂(2020已更新)(哔哩哔哩);科技详细教程小薇...
第8透明(wepoke数据)外... 第8透明(wepoke数据)外挂透明挂辅助神器(辅助挂)透视辅助(2023已更新)(哔哩哔哩);原来...