需要在pom.xml文件中添加以下依赖项:
org.apache.parquet
parquet-hadoop
${parquet.version}
org.xerial.snappy
snappy-java
${snappy.version}
其中${parquet.version}和${snappy.version}分别是parquet-hadoop和snappy-java库的版本号。
然后,在代码中将以下行添加到您的Configuration对象中:
conf.set("io.compression.codecs", "org.apache.hadoop.io.compress.SnappyCodec");
这将解决'org.apache.parquet.hadoop.codec.SnappyCodec was not found”错误。
上一篇:Apache移除包含下划线的标头