按照另一列获取列中最常见的值:
import pandas as pd
# 创建示例数据
data = {'A': ['apple', 'banana', 'apple', 'banana', 'orange'],
'B': ['red', 'yellow', 'red', 'red', 'orange']}
df = pd.DataFrame(data)
# 使用groupby和value_counts获取每个分组中列B的最常见值
most_common_values = df.groupby('A')['B'].apply(lambda x: x.value_counts().idxmax())
print(most_common_values)
输出结果:
A
apple red
banana red
orange orange
Name: B, dtype: object
将pandas系列序列转换为列表的字典:
import pandas as pd
# 创建示例数据
data = {'A': ['apple', 'banana', 'orange'],
'B': ['red', 'yellow', 'orange']}
df = pd.DataFrame(data)
# 将列A作为字典的键,列B作为字典的值,并将其转换为列表的字典
dict_list = df.set_index('A')['B'].to_dict()
print(dict_list)
输出结果:
{'apple': 'red', 'banana': 'yellow', 'orange': 'orange'}