以下是一个按组扩展数据表,添加新行并替换NA值的示例代码:
import pandas as pd
# 创建示例数据表
data = {'Group': ['A', 'A', 'B', 'B'],
'Value': [1, None, 3, 4]}
df = pd.DataFrame(data)
# 按组扩展数据表
expanded_df = df.groupby('Group').apply(lambda x: x.ffill().fillna(0)).reset_index(drop=True)
# 添加新行
new_row = {'Group': 'C', 'Value': None}
expanded_df = expanded_df.append(new_row, ignore_index=True)
# 替换NA值
expanded_df = expanded_df.fillna(0)
print(expanded_df)
输出结果:
Group Value
0 A 1.0
1 A 1.0
2 B 3.0
3 B 4.0
4 C 0.0
在上面的示例代码中,我们首先创建了一个包含组和值的示例数据表。然后,我们使用groupby
函数按组扩展数据表,使用ffill
方法进行向前填充缺失值,并使用fillna
方法将剩余的缺失值替换为0。接下来,我们使用append
方法添加了一行新数据,并使用fillna
方法将新行中的缺失值替换为0。最后,我们打印输出了扩展后的数据表。