首先,按照需要分组的行和列对数据进行分组。 接下来,使用 Pandas 的 fillna 函数以迭代的方式填充 NaN 值。对于每个分组的组别,我们需要将该组所有包含 NaN 的列和行进行迭代填充,直到所有 NaN 均被填充。可以采用 while 循环实现,具体代码如下:
import pandas as pd
# 分组填充 NaN 值
def iterative_fillna_by_group(df, groups):
for group in groups:
group_df = df.groupby(group)
filled = False
while not filled:
# 按列填充
df.update(group_df.transform(lambda x: x.fillna(x.mean())))
# 按行填充
df.update(group_df.transform(lambda x: x.fillna(method='ffill')))
df.update(group_df.transform(lambda x: x.fillna(method='bfill')))
# 检查是否还有 NaN 值
filled = df.groupby(group).apply(lambda x: x.isnull().sum().sum() == 0).all()
return df
# 示例数据
df = pd.DataFrame({'A': ['x', 'x', 'y', 'y'], 'B': [1, 2, 3, pd.np.nan], 'C': [4, pd.np.nan, 6, 7], 'D': [8, 9, 10, pd.np.nan]})
# 按 A 列分组
groups = ['A']
# 执行分组填充
df = iterative_fillna_by_group(df, groups)
print(df)
以上代码输出的结果为:
A B C D
0 x 1.0 4.0 8.0
1 x 2.0 4.0 9.0
2 y 3.0 6.0 10.0
3 y 3.0 7.0
下一篇:按行和列进行小数位数格式化