可以使用Python中的pandas库来解决这个问题。下面是详细的解决方案:
import pandas as pd
df = pd.DataFrame({'A': [1, 1, 2, 2], 'B': [1, 2, 3, 4], 'C': [2, 4, 6, 8]})
这个数据集有三列(A、B、C)和四行。
df.groupby(['A']).cumsum()
这会查找'A'列中的重复项,并对'B'和'C'列的值进行累加。
完整的代码如下:
import pandas as pd
# 创建数据集
df = pd.DataFrame({'A': [1, 1, 2, 2], 'B': [1, 2, 3, 4], 'C': [2, 4, 6, 8]})
# 查找重复项并计算它们的和
df.groupby(['A']).cumsum()
输出:
B C
0 1 2
1 3 6
2 3 6
3 7 14
这将返回一个新的数据集,其中'B'和'C'列的新值是累加的。
上一篇:不重新拉取数据的情况下加载列名
下一篇:不重新排序数据的情况下进行分区