要从div class中提取引号外的值,可以使用Beautiful Soup库。下面是使用Beautiful Soup的代码示例:
from bs4 import BeautifulSoup
# 创建一个HTML文档示例
html = '''
value1
value2
value3
value4
'''
# 使用Beautiful Soup解析HTML文档
soup = BeautifulSoup(html, 'html.parser')
# 查找所有的div标签
div_tags = soup.find_all('div')
# 遍历每个div标签
for div in div_tags:
# 获取div标签的class属性值
class_value = div.get('class')
if class_value:
# 提取引号外的值
class_name = class_value[0].strip("'\"")
print(class_name)
输出结果:
class1
class2
class3
class4
这段代码解析了给定的HTML文档,并使用find_all
方法找到所有的div标签。然后,使用get
方法获取div标签的class属性值,并使用strip
方法去除引号。最后,打印出每个div标签的class值。