要按照序列对pandas dataframe进行分组并选择其中的最大值,可以使用groupby()
函数和max()
函数。
下面是一个示例代码:假设有一个包含姓名、科目和分数的数据集。
import pandas as pd
# 创建数据集
data = {'姓名': ['张三', '李四', '王五', '赵六', '钱七', '孙八'],
'科目': ['数学', '数学', '英语', '英语', '语文', '语文'],
'分数': [90, 80, 95, 85, 88, 92]}
df = pd.DataFrame(data)
# 按照科目分组,并选择分数的最大值
max_scores = df.groupby('科目')['分数'].max()
print(max_scores)
输出结果:
科目
数学 90
英语 95
语文 92
Name: 分数, dtype: int64
在这个示例中,我们首先创建了一个包含姓名、科目和分数的数据字典。然后使用pd.DataFrame()
函数将其转换为pandas dataframe。
接着,我们使用groupby()
函数按照科目对数据进行分组,并使用max()
函数选择每个分组中的最大分数。
最后,我们打印出最大分数的结果。每个科目对应的最大分数被打印出来。