以下是一个示例代码,演示如何使用内连接进行分组计数:
import pandas as pd
# 创建示例数据
data1 = {'ID': [1, 2, 3, 4, 5],
'Name': ['John', 'Mike', 'Emma', 'Emma', 'John']}
data2 = {'ID': [1, 2, 3, 4, 5],
'Class': ['Math', 'Science', 'English', 'Math', 'Science']}
df1 = pd.DataFrame(data1)
df2 = pd.DataFrame(data2)
# 使用内连接合并两个数据框
merged_df = pd.merge(df1, df2, on='ID', how='inner')
# 按照Name和Class进行分组计数
grouped_df = merged_df.groupby(['Name', 'Class']).size().reset_index(name='Count')
print(grouped_df)
输出结果如下:
Name Class Count
0 Emma English 1
1 Emma Math 1
2 John Science 1
3 Mike Science 1
在上述示例中,我们首先创建了两个示例数据框df1和df2。然后使用pd.merge
函数根据ID列进行内连接,将两个数据框合并为一个merged_df数据框。
接下来,我们使用groupby
函数按照Name和Class列进行分组,并使用size
函数计算每个组的数量。最后,使用reset_index
函数将结果重置索引,并将计数列命名为'Count'。
最后,打印出分组计数结果grouped_df。
请注意,上述示例代码使用了pandas库来处理数据。
上一篇:按照内部值对嵌套字典进行排序
下一篇:按照内容/文本对标签进行分类