可以使用pandas库中的groupby和apply函数解决此问题。首先,将数据按组分组。然后,对每个组应用一个函数来获取最小/最大值。但是,在此之前,需要在groupby操作中指定重复的组条件。
下面是一个示例代码:
import pandas as pd
# 创建数据集
data = pd.DataFrame({'group': ['A', 'A', 'B', 'B', 'C', 'C'],
'value': [1, 2, 3, 4, 5, 6]})
# 定义获取最小值的函数
def get_min(group_data):
return group_data.min()
# 按组获取最小值
min_data = data.groupby('group').apply(get_min)
print(min_data)
输出结果:
group
A 1
B 3
C 5
dtype: int64
类似地,也可以使用同样的方法获取最大值。