在Python中,可以使用pandas库来按照一个列进行分组,并从多个列中计数。下面是一个示例代码:
import pandas as pd
# 创建一个示例数据集
data = {'Name': ['John', 'Mike', 'Anna', 'John', 'Mike'],
'Age': [25, 30, 35, 25, 30],
'City': ['NY', 'LA', 'NY', 'LA', 'NY']}
df = pd.DataFrame(data)
# 按照Name列进行分组,并从Age和City列计数
grouped = df.groupby('Name').agg({'Age': 'count', 'City': 'count'})
print(grouped)
输出结果为:
Age City
Name
Anna 1 1
John 2 2
Mike 2 2
在上述代码中,我们首先创建了一个示例数据集df。然后,使用groupby
方法按照Name列进行分组。接下来,使用agg
方法对分组后的数据进行聚合操作,其中{'Age': 'count', 'City': 'count'}
表示对Age和City列进行计数操作。最后,打印输出分组后的统计结果。