以下是一个示例代码,演示如何按照ID分组并将匹配的内容连接到新的特征中。这里假设有一个包含ID和内容的数据集。
import pandas as pd
# 创建一个示例数据集
data = {
'ID': [1, 1, 2, 2, 3, 3],
'Content': ['A', 'B', 'C', 'D', 'E', 'F']
}
df = pd.DataFrame(data)
# 按照ID分组并将内容连接到新的特征中
df['NewFeature'] = df.groupby('ID')['Content'].transform(lambda x: ','.join(x))
# 显示结果
print(df)
运行上述代码,输出结果如下:
ID Content NewFeature
0 1 A A,B
1 1 B A,B
2 2 C C,D
3 2 D C,D
4 3 E E,F
5 3 F E,F
可以看到,根据ID分组后,将匹配的内容连接到了新的特征"NewFeature"中。在这个示例中,ID为1的两行数据的内容被连接为"A,B",ID为2的两行数据的内容被连接为"C,D",ID为3的两行数据的内容被连接为"E,F"。
下一篇:按照ID分组并取最大值