以下是一个按照同一列进行去重计数的示例代码:
import pandas as pd
# 创建示例数据
data = {'Name': ['John', 'Emma', 'John', 'Emma', 'John'],
'Age': [25, 30, 25, 30, 25],
'City': ['New York', 'Los Angeles', 'New York', 'Los Angeles', 'New York']}
df = pd.DataFrame(data)
# 按照 'City' 列进行去重计数
count_df = df.groupby('City').nunique()
# 输出结果
print(count_df['Name'])
输出结果为:
City
Los Angeles 1
New York 1
Name: Name, dtype: int64
这个示例中,我们使用pandas库来处理数据。首先,我们创建一个包含姓名、年龄和城市的示例数据。然后,我们使用groupby
函数按照'City'列对数据进行分组。接着,我们使用nunique
函数对每个分组中的唯一值进行计数。最后,我们输出按照'City'列进行去重计数后的结果。