下面是一个使用Sklearn的LabelEncoder进行编码的示例代码:
from sklearn.preprocessing import LabelEncoder
# 创建一个示例数据框
data = {'color': ['红', '绿', '蓝', '红', '绿']}
df = pd.DataFrame(data)
# 创建LabelEncoder对象
le = LabelEncoder()
# 保留编码的值
df['color_encoded'] = le.fit_transform(df['color'])
# 对新数据框进行编码
new_data = {'color': ['红', '绿', '黄']}
new_df = pd.DataFrame(new_data)
new_df['color_encoded'] = le.transform(new_df['color'])
print(df)
print(new_df)
这段代码首先导入了LabelEncoder
类,然后创建了一个示例数据框df
,其中有一个名为color
的列,包含了一些颜色值。接下来创建了一个LabelEncoder
对象le
。
通过调用fit_transform
方法,LabelEncoder
会根据color
列中的唯一值创建编码,并将编码后的值赋给color_encoded
列。这样就保留了编码的值。
然后,创建了一个新的数据框new_df
,其中包含了一些新的颜色值。通过调用transform
方法,LabelEncoder
会根据之前的编码将新数据框的color
列进行编码,并将编码后的值赋给color_encoded
列。
最后,打印出df
和new_df
,可以看到编码后的结果。
上一篇:保留变量值中的空格