在Python中,可以使用re模块来进行正则表达式匹配。首先需要定义不同数据格式的正则表达式,然后可使用re.match或re.findall等函数进行匹配。
以匹配日期格式为例,假设有以下三种格式:YYYY-MM-DD,YY/MM/DD和YYYY.MM.DD,可以定义如下的正则表达式:
import re
date_regex1 = r'\d{4}-\d{2}-\d{2}' date_regex2 = r'\d{2}/\d{2}/\d{2}' date_regex3 = r'\d{4}.\d{2}.\d{2}'
text = 'Today is 2021-07-15, or maybe 21/07/15, or 2021.07.15'
dates1 = re.findall(date_regex1, text) dates2 = re.findall(date_regex2, text) dates3 = re.findall(date_regex3, text)
print(dates1) # 输出['2021-07-15'] print(dates2) # 输出['21/07/15'] print(dates3) # 输出['2021.07.15']
通过定义三种不同格式的正则表达式,并使用re.findall进行匹配,最终得到了相应格式的日期。
下一篇:不同数据集/列的切片器过滤问题