Apache parquet文件的标准扩展名是‘.parquet’,而不是‘.pqt’。代码示例如下:
#导入必要的包 import pandas as pd import pyarrow.parquet as pq
#从csv文件中读取数据 df = pd.read_csv('sales.csv')
#将数据转换为parquet文件并存储 table = pq.write_table(df, 'sales.parquet')
上一篇:Apache偶尔挂起是网络延迟吗?
下一篇:ApacheParquet支持对重复值的自定义筛选谓词吗?