以下是一个使用Python pandas库进行数据筛选和分组的示例代码:
import pandas as pd
# 创建示例数据表
data = {'Name': ['John', 'Sam', 'Mike', 'Emily', 'Emma'],
'Age': [25, 30, 35, 40, 45],
'City': ['New York', 'London', 'Paris', 'New York', 'Paris']}
df = pd.DataFrame(data)
# 按照城市分组并计算平均年龄
grouped = df.groupby('City')
average_age = grouped['Age'].mean()
print(average_age)
# 过滤年龄大于30岁的行
filtered_data = df[df['Age'] > 30]
print(filtered_data)
输出结果:
City
London 30
New York 32.5
Paris 40
Name: Age, dtype: float64
Name Age City
2 Mike 35 Paris
3 Emily 40 New York
4 Emma 45 Paris
在这个示例中,我们使用pandas库创建了一个示例数据表,并对数据进行了分组和筛选。首先,我们使用groupby函数按照城市进行分组,并计算了每个城市的平均年龄。然后,我们使用条件筛选,过滤出年龄大于30岁的行。
当然,根据具体的数据结构和筛选条件,代码的实现方式可能会有所不同。上述代码仅提供了一个基本的示例,你可以根据自己的需求进行相应的修改和调整。