langchain_community.document_loaders.obsidian.ObsidianLoader¶
- class langchain_community.document_loaders.obsidian.ObsidianLoader(path: Union[str, Path], encoding: str = 'UTF-8', collect_metadata: bool = True)[source]¶
从目录中加载 Obsidian 文件。
使用路径进行初始化。
- 参数
path (Union[str, Path]) – 包含 Obsidian 文件的目录路径。
encoding (str) – 字符集编码,默认为 “UTF-8”
collect_metadata (bool) – 是否从封面前端收集元数据。默认为 True。
属性
DATAVIEW_INLINE_BRACKET_REGEXDATAVIEW_INLINE_PAREN_REGEXDATAVIEW_LINE_REGEXFRONT_MATTER_REGEXTAG_REGEXTEMPLATE_VARIABLE_REGEX方法
__init__(path[, encoding, collect_metadata])使用路径进行初始化。
Documents 的懒加载器。
aload()将数据加载到 Document 对象中。
Documents 的懒加载器。
load()将数据加载到 Document 对象中。
load_and_split([text_splitter])加载 Documents 并分割成多个块。
- __init__(path: Union[str, Path], encoding: str = 'UTF-8', collect_metadata: bool = True)[源代码]¶
使用路径进行初始化。
- 参数
path (Union[str, Path]) – 包含 Obsidian 文件的目录路径。
encoding (str) – 字符集编码,默认为 “UTF-8”
collect_metadata (bool) – 是否从封面前端收集元数据。默认为 True。
- load_and_split(text_splitter: Optional[TextSplitter] = None) List[Document]¶
加载文档并将它们分割为块。块作为文档返回。
不要重写此方法。应考虑将其弃用!
- 参数
text_splitter (可选 [ TextSplitter ]) – 用于分割文档的 TextSplitter 实例。默认为 RecursiveCharacterTextSplitter。
- 返回
文档列表。
- 返回类型
文档列表[Document]