以下是一个示例代码,演示如何按照一列对数据进行分组,并根据每个组中的行创建一个新列。
import pandas as pd
# 创建示例数据
data = {'Name': ['John', 'Emily', 'Josh', 'Emily', 'John'],
'Age': [28, 32, 25, 32, 28]}
df = pd.DataFrame(data)
# 按照 'Name' 列进行分组,并根据每个组中的行创建一个新列 'Count'
df['Count'] = df.groupby('Name').cumcount() + 1
# 输出结果
print(df)
输出结果如下:
Name Age Count
0 John 28 1
1 Emily 32 1
2 Josh 25 1
3 Emily 32 2
4 John 28 2
在这个示例中,我们使用了Pandas库来处理数据。首先,我们创建了一个包含姓名和年龄的字典。然后,我们使用该字典创建了一个数据帧。接下来,我们使用groupby()
方法按照 'Name' 列对数据进行分组。然后,我们使用cumcount()
方法在每个组中的行上创建一个计数器列。最后,我们将新列 'Count' 添加到数据帧中,并输出结果。