Apache Tika：从归档中提取文件名和MIME类型_程序开发

Apache Tika：从归档中提取文件名和MIME类型

创始人

2024-09-05 01:00:45

0次

以下是使用Apache Tika从归档中提取文件名和MIME类型的示例代码：

import org.apache.tika.metadata.Metadata;
import org.apache.tika.mime.MediaType;
import org.apache.tika.parser.AutoDetectParser;
import org.apache.tika.parser.ParseContext;
import org.apache.tika.sax.BodyContentHandler;

import java.io.File;
import java.io.FileInputStream;
import java.io.InputStream;

public class ArchiveFileExtractor {
    public static void main(String[] args) {
        File file = new File("path/to/archive/file.zip");

        try {
            // 创建Tika解析器
            AutoDetectParser parser = new AutoDetectParser();

            // 创建内容处理器
            BodyContentHandler handler = new BodyContentHandler();

            // 创建元数据对象
            Metadata metadata = new Metadata();

            // 创建解析上下文
            ParseContext context = new ParseContext();

            // 设置解析器的上下文
            context.set(Parser.class, parser);

            // 创建文件输入流
            InputStream stream = new FileInputStream(file);

            // 使用Tika解析器提取文件名和MIME类型
            parser.parse(stream, handler, metadata, context);

            // 获取提取的文件名
            String fileName = metadata.get(Metadata.RESOURCE_NAME_KEY);

            // 获取提取的MIME类型
            MediaType mediaType = MediaType.parse(metadata.get(Metadata.CONTENT_TYPE));

            System.out.println("文件名: " + fileName);
            System.out.println("MIME类型: " + mediaType.toString());

            // 关闭输入流
            stream.close();
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

请将"path/to/archive/file.zip"替换为您想要提取文件名和MIME类型的归档文件的路径。

上一篇：Apache TIKA：尝试分配长度为1835606的数组，但此记录类型的最大长度为1000000。

下一篇：Apache Tika：解析的PDF包含矩形框，如何移除/解析这些字符？

Apache Tika：从归档中提取文件名和MIME类型

相关内容

热门资讯