可以使用pandas库中的groupby和apply方法来解决该问题。下面是一个示例代码:
import pandas as pd
# 创建一个数据框
df = pd.DataFrame({
'group': ['A', 'A', 'B', 'B', 'B', 'C'],
'item': ['X', 'Y', 'Z', 'X', 'Y', 'Z']
})
# 根据group列进行分组,并在每个组内获取唯一组合
result = df.groupby('group').apply(lambda x: tuple(sorted(set(x['item']))))
print(result)
该代码将数据框按group列进行分组,并在每个组内获取唯一组合。具体来说,apply方法将对每个分组执行lambda函数,该函数将一列item转换为一个set,然后将其排序并转换为一个元组。最后,apply方法将每个分组的结果组合成一个新的Series,并返回一个包含每个组唯一组合的结果数组。
上一篇:按组的SQL第一个值
下一篇:按组迭代R,并根据列值映射值。