下面是一个解决方案,其中包括一个函数count_unique_names
,该函数接受一个数据集和列名称作为参数,并返回该列中唯一名称的数量。
import pandas as pd
def count_unique_names(dataset, column_name):
unique_names = dataset[column_name].unique()
return len(unique_names)
# 示例数据集
dataset = pd.DataFrame({'Name': ['Alice', 'Bob', 'Alice', 'Charlie', 'Bob']})
# 调用函数并打印结果
print(count_unique_names(dataset, 'Name')) # 输出:3
解决方案使用了pandas
库来处理数据集。首先,我们使用unique()
函数获取指定列中的唯一名称,然后使用len()
函数获取唯一名称的数量。在示例中,数据集包含了一个名为Name
的列,我们调用count_unique_names
函数来计算该列中唯一名称的数量,并打印结果。最终输出结果为3
,因为数据集中有三个唯一的名称:Alice、Bob和Charlie。