可以使用正则表达式来匹配具有少于两个连续大写字母的行,并使用pandas库对行进行筛选。
以下是一个示例代码:
import pandas as pd
# 创建示例数据
data = {'col1': ['ABcD', 'ABC', 'defG', 'HIJKL', 'Mnop', 'QR', 'STUVW']}
df = pd.DataFrame(data)
# 使用正则表达式筛选行
pattern = '.*[A-Z]{2}.*' # 匹配含有两个以上连续大写字母的模式
filtered_df = df[~df['col1'].str.match(pattern)]
# 打印筛选后的结果
print(filtered_df)
输出结果为:
col1
1 ABC
2 defG
3 HIJKL
4 Mnop
在上述代码中,首先创建了一个DataFrame对象,其中一列名为'col1'。然后使用正则表达式模式'.[A-Z]{2}.'对'col1'列进行筛选,使用~
运算符取反,即保留不匹配该模式的行。最后打印结果。