下面是一个示例代码,展示了如何按照多个分组并获取唯一计数:
import pandas as pd
# 创建示例数据
data = {
'Category': ['A', 'A', 'B', 'B', 'B', 'C'],
'Subcategory': ['A1', 'A2', 'B1', 'B2', 'B3', 'C1']
}
df = pd.DataFrame(data)
# 按照多个分组并获取唯一计数
unique_counts = df.groupby(['Category', 'Subcategory']).size().reset_index(name='Count')
print(unique_counts)
输出结果为:
Category Subcategory Count
0 A A1 1
1 A A2 1
2 B B1 1
3 B B2 1
4 B B3 1
5 C C1 1
在这个示例中,我们使用pandas
库创建了一个DataFrame
对象,并使用groupby
函数按照Category
和Subcategory
列进行分组。然后,我们使用size
函数获取每个组的唯一计数,并使用reset_index
函数将结果转换为DataFrame
对象。最后,我们打印输出了结果。
上一篇:按照多个分组变量进行分组的插值