以下是一个使用Python的示例代码,用于按照两个层级分组获取记录的数量:
import pandas as pd
# 创建一个示例数据集
data = {
'Category': ['A', 'A', 'B', 'B', 'A', 'A', 'B', 'B'],
'Subcategory': ['X', 'Y', 'X', 'Y', 'X', 'Y', 'X', 'Y'],
'Value': [1, 2, 3, 4, 5, 6, 7, 8]
}
df = pd.DataFrame(data)
# 按照两个层级分组,并计算每个组的记录数量
grouped = df.groupby(['Category', 'Subcategory']).size().reset_index(name='Count')
print(grouped)
这段代码首先使用pandas
库创建了一个示例的数据集,其中包含了Category
(类别)、Subcategory
(子类别)和Value
(值)三列。然后,使用groupby
函数将数据按照Category
和Subcategory
两个列进行分组,并使用size
函数计算每个组的记录数量。最后,通过reset_index
函数将结果转换为一个新的DataFrame
对象,并将计数结果命名为Count
列。最终,我们打印出了分组后的结果。
输出结果如下:
Category Subcategory Count
0 A X 2
1 A Y 2
2 B X 2
3 B Y 2
该结果显示了每个类别和子类别的记录数量。