以下是一个示例代码,演示了如何按照匹配模式进行分组并保留列:
import pandas as pd
# 创建示例数据
data = {'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Eve'],
'Age': [25, 30, 35, 40, 45],
'City': ['New York', 'Paris', 'London', 'Paris', 'New York'],
'Group': ['GroupA', 'GroupB', 'GroupA', 'GroupB', 'GroupA']}
df = pd.DataFrame(data)
# 定义匹配模式
pattern = 'Group([A|B])'
# 使用正则表达式进行分组
df['Group'] = df['Group'].str.extract(pattern)
# 保留需要的列
df = df[['Name', 'Age', 'City', 'Group']]
# 打印结果
print(df)
这段代码首先创建了一个包含姓名、年龄、城市和分组的DataFrame。然后,我们定义了一个匹配模式,该模式可以从字符串中提取出GroupA
或GroupB
。接下来,我们使用str.extract()
函数将匹配模式应用到Group
列上,以实现按照匹配模式进行分组。最后,我们使用[['Name', 'Age', 'City', 'Group']]
将需要的列保留下来,并打印出结果。
上一篇:按照匹配键合并数据框
下一篇:按照匹配数量排序