langchain_core.document_loaders.base.BaseBlobParser

class langchain_core.document_loaders.base.BaseBlobParser[source]

blob解析器的抽象接口。

blob解析器提供了一种将存储在blob中的原始数据解析为一个或多个文档的方法。

解析器可以与blob加载器组合使用,这使得在独立于blob原始加载方式的情况下重复使用解析器变得容易。

方法

__init__()

lazy_parse(blob)

延迟解析接口。

parse(blob)

贪婪地将blob解析为一个或多个文档。

__init__()
abstract lazy_parse(blob: Blob) Iterator[Document][source]

延迟解析接口。

子类必须实现此方法。

参数

blob (Blob) – Blob实例

返回

文档生成器

返回类型

Iterator[Document]

parse(blob: Blob) List[Document][source]

贪婪地将blob解析为一个或多个文档。

这是一个用于交互式开发环境的便捷方法。

生产应用应优先使用lazy_parse方法。

子类通常不应重写此解析方法。

参数

blob (Blob) – Blob实例

返回

文档列表

返回类型

列表[Document]

使用BaseBlobParser的示例