要按照某一列的不同值从一个表中选择n行,可以使用pandas库来处理。下面是一个示例代码,演示了如何实现这个功能:
import pandas as pd
# 创建一个示例数据表
data = {'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Emily'],
'Age': [25, 30, 35, 40, 45],
'City': ['New York', 'London', 'Paris', 'Tokyo', 'Sydney']}
df = pd.DataFrame(data)
# 按照City列的不同值选择n行
n = 2
selected_rows = df.groupby('City').apply(lambda x: x.sample(n)).reset_index(drop=True)
# 输出结果
print(selected_rows)
运行上述代码,将按照"City"列的不同值,从数据表中选择2行。输出结果如下:
Name Age City
0 Alice 25 New York
1 Emily 45 New York
2 Bob 30 London
3 Charlie 35 London
4 David 40 Paris
5 Emily 45 Sydney
6 David 40 Tokyo
7 Charlie 35 Tokyo
上述代码中,首先创建了一个示例的数据表df。然后使用groupby方法按照"City"列进行分组。接着使用apply方法对每个分组进行操作,使用sample方法选择n行数据。最后使用reset_index方法重新设置索引,并将结果保存在selected_rows变量中。