假设我们有一个名为data的数据框,其中包含列A、列B和列C。下面是按照“Col A”分组,计算“Col C”的数量,并计算“Col B”的唯一值数量的代码示例:
import pandas as pd
# 创建示例数据
data = pd.DataFrame({'Col A': ['A', 'A', 'B', 'B', 'C'],
'Col B': [1, 2, 3, 4, 5],
'Col C': [10, 20, 30, 40, 50]})
# 按照"Col A"分组,计算"Col C"的数量
count_colC = data.groupby('Col A')['Col C'].count()
# 计算"Col B"的唯一值数量
unique_colB = data['Col B'].nunique()
# 打印结果
print(count_colC)
print(unique_colB)
输出结果:
Col A
A 2
B 2
C 1
Name: Col C, dtype: int64
5
在上面的代码中,我们使用pandas库来处理数据。首先,我们创建了一个名为data的数据框,并向其添加了示例数据。然后,我们使用groupby函数按照“Col A”分组,并计算每个分组中“Col C”的数量。计算结果存储在变量count_colC中。接下来,我们使用nunique函数计算“Col B”的唯一值数量,并将结果存储在变量unique_colB中。最后,我们分别打印出count_colC和unique_colB的结果。