您可以使用正则表达式将字符串拆分为数字和单词,并将其转换为索引列和拆分列。
下面是一个示例代码:
import pandas as pd
import re
# 创建示例数据
data = {'text': ['abc12def', '123xyz456', '789pqr']}
df = pd.DataFrame(data)
# 使用正则表达式将字符串拆分为数字和单词
df['index'] = df['text'].apply(lambda x: re.findall(r'\d+|\D+', x))
# 将拆分的结果转换为索引列和拆分列
df['index'] = df['index'].apply(lambda x: x[0])
df['split'] = df['index'].apply(lambda x: x[1])
# 删除原始文本列
df.drop('text', axis=1, inplace=True)
# 打印结果
print(df)
输出结果为:
index split
0 abc 12
1 123 xyz
2 789 pqr
在这个示例中,我们使用正则表达式将字符串拆分为数字和非数字部分,并将结果存储在名为'index'的新列中。然后,我们将'index'列中的第一个元素作为索引列,将第二个元素作为拆分列。最后,我们删除原始的文本列,并打印结果。
上一篇:保留所选文件以供进一步使用