以下是一个示例代码,演示如何按照共同的电子邮件将其他字段进行分组:
import pandas as pd
# 创建一个示例数据框
data = {'姓名': ['张三', '李四', '王五', '赵六', '钱七'],
'电子邮件': ['zhangsan@example.com', 'lisi@example.com', 'wangwu@example.com', 'zhaoliu@example.com', 'qianqi@example.com'],
'电话号码': ['11111111', '22222222', '33333333', '44444444', '55555555']}
df = pd.DataFrame(data)
# 根据电子邮件字段进行分组
grouped = df.groupby('电子邮件')
# 打印每个分组的内容
for email, group in grouped:
print("电子邮件:", email)
print(group)
print('\n')
输出结果如下:
电子邮件: lisi@example.com
姓名 电子邮件 电话号码
1 李四 lisi@example.com 22222222
电子邮件: qianqi@example.com
姓名 电子邮件 电话号码
4 钱七 qianqi@example.com 55555555
电子邮件: wangwu@example.com
姓名 电子邮件 电话号码
2 王五 wangwu@example.com 33333333
电子邮件: zhangsan@example.com
姓名 电子邮件 电话号码
0 张三 zhangsan@example.com 11111111
电子邮件: zhaoliu@example.com
姓名 电子邮件 电话号码
3 赵六 zhaoliu@example.com 44444444
以上代码使用pandas库创建了一个示例数据框,并根据电子邮件字段进行分组。然后,通过遍历每个分组,可以打印出每个分组的内容。