langchain_community.document_loaders.acreom
.AcreomLoader¶
- class langchain_community.document_loaders.acreom.AcreomLoader(path: Union[str, Path], encoding: str = 'UTF-8', collect_metadata: bool = True)[source]¶
从目录中加载 acreom 保险库。
初始化加载器。
属性
FRONT_MATTER_REGEX
用于匹配 Markdown 文件中前面的元数据的正则表达式。
file_path
Markdown 文件的目录路径。
encoding
读取文件时使用的编码。
collect_metadata
是否从前面事项中收集元数据。
方法
__init__
(path[, encoding, collect_metadata])初始化加载器。
Document 的懒加载器。
aload
()将数据加载到 Document 对象中。
Document 的懒加载器。
load
()将数据加载到 Document 对象中。
load_and_split
([text_splitter])加载 Documents 并按块分割。
- 参数
path (Union[str, Path]) –
encoding (str) –
collect_metadata (bool) –
- __init__(path: Union[str, Path], encoding: str = 'UTF-8', collect_metadata: bool = True)[source]¶
初始化加载器。
- 参数
path (Union[str, Path]) –
encoding (str) –
collect_metadata (bool) –
- load_and_split(text_splitter: Optional[TextSplitter] = None) List[Document] ¶
加载数据并将其分割成块。块以文档的形式返回。
请不要覆盖此方法。应考虑将其弃用!
- 参数
text_splitter (可选[TextSplitter]) – 用于分割文档的TextSplitter实例。默认为RecursiveCharacterTextSplitter。
- 返回
文档列表。
- 返回类型
List[Document]