我们可以使用正则表达式找到所有符合日期格式的字符串,然后逐一解析。
例如,假设我们想要找到HTML代码中所有符合'YYYY-MM-DD”格式的日期,我们可以这样写代码:
import re from bs4 import BeautifulSoup
html = '''
Today is 2022-12-23
Tomorrow is 2022-12-24
Yesterday was 2022-12-22
'''soup = BeautifulSoup(html, 'html.parser') date_regex = re.compile('\d{4}-\d{2}-\d{2}') dates = soup.find_all(text=date_regex)
print(dates)
输出结果为:['2022-12-23', '2022-12-24', '2022-12-22']
这样我们就成功地找到了所有日期。