要使用BeautifulSoup解析HTML文档并提取所有的元数据关键字,可以使用BeautifulSoup的.find_all()
方法来查找所有的HTML标签,并使用.attrs
属性来获取标签的所有属性。
以下是一个示例代码:
from bs4 import BeautifulSoup
html = '''
Hello, World!
'''
soup = BeautifulSoup(html, 'html.parser')
# 查找所有的meta标签
meta_tags = soup.find_all('meta')
# 打印所有的属性
for tag in meta_tags:
print(tag.attrs)
以上代码将输出所有的meta标签的属性,包括name、content和property属性。
如果你只想查找特定的属性,可以在find_all()
方法中使用attrs
参数来过滤标签。例如,要查找所有具有name属性的meta标签,可以使用以下代码:
# 查找具有name属性的meta标签
meta_tags = soup.find_all('meta', attrs={'name': True})
# 打印所有的属性
for tag in meta_tags:
print(tag.attrs)
这样可以只显示具有name属性的meta标签的属性。