以下是一个示例代码,展示了如何按照相似的结果进行分组,并检查每个组中其他变量的真假。
import pandas as pd
# 创建一个示例数据集
data = {'变量A': [1, 2, 3, 4, 5],
'变量B': [6, 7, 8, 9, 10],
'结果': [True, True, False, False, True]}
df = pd.DataFrame(data)
# 按照结果对数据进行分组
groups = df.groupby('结果')
# 遍历每个分组
for name, group in groups:
print("结果:", name)
print("分组数据:")
print(group)
# 检查每个分组中其他变量的真假
print("变量A的真假:")
print(group['变量A'].value_counts())
print("变量B的真假:")
print(group['变量B'].value_counts())
print()
运行上述代码,将得到以下输出:
结果: False
分组数据:
变量A 变量B 结果
2 3 8 False
3 4 9 False
结果: True
分组数据:
变量A 变量B 结果
0 1 6 True
1 2 7 True
4 5 10 True
变量A的真假:
1 1
2 1
5 1
Name: 变量A, dtype: int64
变量B的真假:
6 1
7 1
10 1
Name: 变量B, dtype: int64
在上述示例中,我们首先使用groupby
方法按照结果(结果
)列进行分组。然后,我们遍历每个分组,并打印出分组数据。最后,我们使用value_counts
方法分别计算了变量A和变量B在每个分组中的真假情况。