langchain_community.document_loaders.unstructured
.UnstructuredBaseLoader¶
- 类 langchain_community.document_loaders.unstructured.UnstructuredBaseLoader(mode: str = 'single', post_processors: Optional[List[Callable[[str], str]]]] = None, **unstructured_kwargs: Any)[源代码]¶
使用 Unstructured 的基本加载器。
使用文件路径初始化。
方法
__init__
([mode, post_processors])使用文件路径初始化。
文档的懒加载器。
aload
()将数据加载到文档对象中。
加载文件。
load
()将数据加载到文档对象中。
load_and_split
([text_splitter])加载文档并将它们分割成块。
- 参数
mode (str) –
post_processors (Optional[List[Callable[[str], str]]]) –
unstructured_kwargs (Any) –
- __init__(mode: str = 'single', post_processors: Optional[List[Callable[[str], str]]]] = None, **unstructured_kwargs: Any)[源代码]¶
使用文件路径初始化。
- 参数
mode (str) –
post_processors (Optional[List[Callable[[str], str]]]) –
unstructured_kwargs (Any) –
- load_and_split(text_splitter: Optional[TextSplitter] = None) List[Document] ¶
加载文档并将其分割成块。块作为文档返回。
不要重写此方法。应将其视为已弃用!
- 参数
text_splitter (可选[TextSplitter]) – 用于分割文档的TextSplitter实例。默认为RecursiveCharacterTextSplitter。
- 返回值
文档列表。
- 返回类型
列表[文档]