要按照2列进行分组,并筛选字符串列,可以使用Python的pandas库进行处理。以下是一个示例代码:
import pandas as pd
# 创建示例数据
data = {
'col1': [1, 1, 2, 2, 3, 3],
'col2': [4, 5, 6, 7, 8, 9],
'col3': ['a', 'b', 'c', 'd', 'e', 'f']
}
df = pd.DataFrame(data)
# 按照col1和col2进行分组,并筛选col3列
filtered_df = df.groupby(['col1', 'col2'])['col3'].apply(list).reset_index()
print(filtered_df)
输出结果:
col1 col2 col3
0 1 4 [a]
1 1 5 [b]
2 2 6 [c]
3 2 7 [d]
4 3 8 [e]
5 3 9 [f]
在示例代码中,首先创建了一个包含三列的示例数据。然后使用pandas的groupby函数按照col1和col2进行分组,并使用apply函数将col3列的值转换为列表。最后使用reset_index函数重置索引。输出结果是按照col1和col2进行分组,并筛选出col3列的结果。