可以使用iterrows()函数来遍历数据框中的每一行,并对每一行进行清理。下面是一个示例代码:
import pandas as pd
# 创建示例数据框
data = {'姓名': ['张三', '李四', '王五'],
'年龄': [25, 30, 35],
'性别': ['男', '女', '男'],
'地址': ['北京', '上海', '广州']}
df = pd.DataFrame(data)
# 遍历数据框中的每一行
for index, row in df.iterrows():
# 对每一行进行清理处理
# 这里只是示例,可以根据实际情况进行适当的清理操作
cleaned_row = {
'姓名': row['姓名'].strip(),
'年龄': row['年龄'],
'性别': row['性别'].upper(),
'地址': row['地址'].capitalize()
}
# 更新原始数据框中的对应行
df.loc[index] = cleaned_row
# 输出清理后的数据框
print(df)
运行上述代码,输出结果如下:
姓名 年龄 性别 地址
0 张三 25 男 北京
1 李四 30 女 上海
2 王五 35 男 广州
在示例代码中,遍历数据框的每一行时,使用strip()方法去除姓名列中的空格,使用upper()方法将性别列的值转换为大写,使用capitalize()方法将地址列的值首字母大写。根据实际需要,可以对每一行的数据进行各种清理操作。
上一篇:遍历数据框中唯一值列表