langchain_community.document_loaders.parsers.pdf
.PyPDFium2Parser¶
- class langchain_community.document_loaders.parsers.pdf.PyPDFium2Parser(extract_images: bool = False)[source]¶
使用 PyPDFium2 解析 PDF。
初始化解析器。
方法
__init__
([extract_images])初始化解析器。
lazy_parse
(blob)懒解析blob。
parse
(blob)急切地将blob解析成文档或多个文档。
- 参数
extract_images (bool) –