PdfParser 0.9.3 使用 TCPDF 外部库用来解析 PDF 文件,一旦完成,数据会在内部被处理并准备好抽取其中文本。
PdfParser 是一个标准的 PHP 库提供个用于从 PDF 文件中抽取数据的工具。它加载 PDF 文件并解析文件中对象、头和元数据,可抽取其中的文本信息,支持压缩的 PDF、MAC OS 罗马字符集编码、8进制和16进制编码。兼容 PSR-0 和 PSR-1。
官方首页:https://github.com/smalot/pdfparser
来自:开源中国社区

