langchain_community документ_загрузчиков.p Přensorovicians.grobid
.GrobidParser¶
- class langchain_community.文档_加载器.解析器.grobid.GrobidParser(segment_sentences: bool = 'false', grobid_server: str = 'http://localhost:8070/api/processFulltextDocument')[源代码]¶
使用 Grobid 加载 PDF 文章文件。
方法
__init__
(segment_sentences[, grobid_server])lazy_parse
(blob)懒加载解析接口。
parse
(blob)急切地将 blob 解析成文档或文档列表。
process_xml
(file_path, xml_data, ...)处理 Grobid 的 XML 文件。
- 参数
segment_sentences (布尔值) –
grobid_server (字符串) –
- __init__(segment_sentences: bool, grobid_server: str = 'http://localhost:8070/api/processFulltextDocument') None [source]¶
- 参数
segment_sentences (布尔值) –
grobid_server (字符串) –
- 返回类型
None