要按照正则表达式将Pandas列拆分,可以使用str.extract()
方法。
以下是一个示例代码:
import pandas as pd
# 创建一个示例数据集
data = {'Name': ['John Doe', 'Jane Smith', 'Mike Johnson'],
'Age': [25, 30, 35],
'Email': ['john@example.com', 'jane@example.com', 'mike@example.com']}
df = pd.DataFrame(data)
# 使用正则表达式将Name列拆分为First Name和Last Name两列
df[['First Name', 'Last Name']] = df['Name'].str.extract(r'(\w+)\s(\w+)')
# 打印拆分后的结果
print(df)
输出结果:
Name Age Email First Name Last Name
0 John Doe 25 john@example.com John Doe
1 Jane Smith 30 jane@example.com Jane Smith
2 Mike Johnson 35 mike@example.com Mike Johnson
在上面的代码中,我们使用str.extract()
方法将Name列拆分为First Name和Last Name两列。我们使用的正则表达式(\w+)\s(\w+)
将Name列拆分为以空格分隔的两个单词。拆分后的结果存储在新创建的两列中。