使用Python语言的PyPDF2库可以读取PDF文档。示例代码如下:
import PyPDF2
# 打开PDF文件
pdf_file = open('example.pdf', 'rb')
# 创建一个PdfFileReader对象
pdf_reader = PyPDF2.PdfFileReader(pdf_file)
# 打印PDF文件信息
print('Title:', pdf_reader.getDocumentInfo().title)
print('Number of pages:', pdf_reader.getNumPages())
# 读取PDF文件中的文本
page = pdf_reader.getPage(0)
text = page.extractText()
print(text)
# 关闭PDF文件
pdf_file.close()
该程序可以读取名为“example.pdf”的PDF文件,并输出该文件的标题、页数以及第一页的文本内容。需要注意的是,要先以二进制模式打开PDF文件,并在使用完后手动关闭该文件。