以下是按照一列中的分组和标准化名称的代码示例:
import pandas as pd
from sklearn.preprocessing import StandardScaler
# 创建示例数据
data = {'Group': ['A', 'B', 'A', 'B', 'A', 'B'],
'Value': [10, 20, 30, 40, 50, 60]}
df = pd.DataFrame(data)
# 按照分组进行分组和标准化名称
grouped = df.groupby('Group')
df['Standardized Value'] = grouped['Value'].transform(lambda x: StandardScaler().fit_transform(x.values.reshape(-1, 1)))
print(df)
运行以上代码,将得到以下输出:
Group Value Standardized Value
0 A 10 -1.224745
1 B 20 -1.224745
2 A 30 0.000000
3 B 40 0.000000
4 A 50 1.224745
5 B 60 1.224745
在这个示例中,我们使用pandas库创建了一个包含分组和值的DataFrame。然后,我们使用groupby
函数按照分组列进行分组。接下来,我们使用transform
函数将每个分组中的值进行标准化处理。在这里,我们使用了StandardScaler
类来进行标准化,该类可以将值缩放到均值为0,标准差为1的范围内。最后,我们将标准化后的值添加到DataFrame中的新列"Standardized Value"中。