你可以使用pandas库中的groupby
函数来实现按照日期和id分组创建索引列。以下是一个示例代码:
import pandas as pd
# 创建示例数据
data = {
'date': ['2021-01-01', '2021-01-01', '2021-01-02', '2021-01-02'],
'id': [1, 2, 1, 2],
'value': [10, 20, 30, 40]
}
df = pd.DataFrame(data)
# 按照日期和id分组,并创建索引列
df['index'] = df.groupby(['date', 'id']).ngroup()
print(df)
输出结果:
date id value index
0 2021-01-01 1 10 0
1 2021-01-01 2 20 1
2 2021-01-02 1 30 2
3 2021-01-02 2 40 3
在上述代码中,首先创建了一个包含日期、id和value的示例数据DataFrame。然后使用groupby
方法按照日期和id进行分组,再使用ngroup
方法创建索引列并将其赋值给新的列index
。最后打印输出整个DataFrame。
下一篇:按照日期和ID排序变量