可以使用Pandas的str.contains()函数来检查列名中是否包含特定的子字符串,然后使用该函数与lambda函数组合,以便仅保留具有特定子字符串的列。
以下是代码示例:
import pandas as pd
# 创建示例数据
data = {'Column_1': [1, 2, 3], 'Column_2': [4, 5, 6], 'Column_3': [7, 8, 9], 'Column_4': [10, 11, 12]}
df = pd.DataFrame(data)
# 要保留的子字符串列表
substrings = ['Column_1', 'Column_3']
# 使用str.contains()和lambda函数筛选列
df = df.loc[:, df.columns.str.contains('|'.join(substrings))]
print(df)
此代码将仅保留包含'Column_1”和'Column_3”子字符串的数据帧列。 输出如下:
Column_1 Column_3
0 1 7
1 2 8
2 3 9