使用compression参数将HDF5文件压缩以减少文件大小。以下是一段示例代码:
import pandas as pd
# 创建包含字符串值列的DataFrame
df = pd.DataFrame({'col1': [1, 2, 3], 'col2': ['a', 'b', 'c']})
# 将DataFrame保存为HDF5文件并使用压缩
df.to_hdf('data.h5', key='df', mode='w', format='table', complib='blosc', complevel=9)
在这个示例中,我们将compression参数设置为'blosc'并使用complevel参数设置压缩级别。通常,blosc是一个不错的选择,因为它可以提供非常快的压缩速度和良好的压缩率。通过调整complevel参数,您可以进一步调整压缩水平,以平衡文件大小和读取速度之间的权衡。
上一篇:包含字符串和整数的二维列表
下一篇:包含字符单元格的文本文件。