以下是一个使用Python的代码示例,实现按照分隔符爆炸列,并将分割列名称的前缀作为值使用:
import pandas as pd
# 创建示例数据帧
data = {'col1': ['A_value1', 'B_value1', 'C_value1'],
'col2': ['A_value2', 'B_value2', 'C_value2'],
'col3': ['A_value3', 'B_value3', 'C_value3']}
df = pd.DataFrame(data)
# 分隔符
delimiter = '_'
# 爆炸列并将前缀作为值使用
df = df.apply(lambda x: x.str.split(delimiter, expand=True).stack().reset_index(level=1, drop=True).rename(x.name + '_prefix').reset_index(), axis=1).drop('level_1', axis=1)
# 输出结果
print(df)
此代码将输入的数据帧按照指定的分隔符进行列爆炸,并将分割列名称的前缀作为值添加到新的列中。输出结果为:
index col1_prefix col2_prefix col3_prefix
0 0 A A A
1 0 value1 value2 value3
2 1 B B B
3 1 value1 value2 value3
4 2 C C C
5 2 value1 value2 value3
其中,index
列表示原始数据帧的索引,col1_prefix
、col2_prefix
、col3_prefix
列表示分割列名称的前缀作为值。
下一篇:按照分隔符拆分列并删除扩展列