langchain_core.document_loaders.base
.BaseLoader¶
- class langchain_core.document_loaders.base.BaseLoader[source]¶
文档加载器接口。
实现应使用生成器实现延迟加载方法,以避免一次性将所有文档加载到内存中。
load 仅提供便利性,不应重写。
方法
__init__
()文档的延迟加载器。
aload
()将数据加载到文档对象中。
文档的延迟加载器。
load
()将数据加载到文档对象中。
load_and_split
([text_splitter])加载文档并将它们分割成块。
- __init__()¶
- load_and_split(text_splitter: Optional[TextSplitter] = None) List[Document] [来源代码]¶
加载数据文件并将它们分割成块。块作为Document返回。
不要重写此方法。应考虑将其视为已弃用!
- 参数
text_splitter (可选[TextSplitter]) - 用于分割文档的TextSplitter实例。默认为RecursiveCharacterTextSplitter。
- 返回
文档列表。
- 返回类型
列表[Document]