langchain_community.document_loaders.lakefs
.UnstructuredLakeFSLoader¶
- class langchain_community.document_loaders.lakefs.UnstructuredLakeFSLoader(url: str, repo: str, ref: str = 'main', path: str = '', presign: bool = True, **unstructured_kwargs: Any)[源代码]¶
从 lakeFS 加载非结构化数据。
初始化 UnstructuredLakeFSLoader。
参数
- 参数
lakefs_access_key –
lakefs_secret_key –
lakefs_endpoint –
repo (str) –
ref (str) –
url (str) –
path (str) –
presign (bool) –
unstructured_kwargs (Any) –
方法
__init__
(url, repo[, ref, path, presign])初始化 UnstructuredLakeFSLoader。
Documents 的 lazy loader。
aload
()将数据加载到 Document 对象中。
加载文件。
load
()将数据加载到 Document 对象中。
load_and_split
([text_splitter])加载 Documents 并分割成块。
- __init__(url: str, repo: str, ref: str = 'main', path: str = '', presign: bool = True, **unstructured_kwargs: Any)[来源代码]¶
初始化 UnstructuredLakeFSLoader。
参数
- 参数
lakefs_access_key –
lakefs_secret_key –
lakefs_endpoint –
repo (str) –
ref (str) –
url (str) –
path (str) –
presign (bool) –
unstructured_kwargs (Any) –
- load_and_split(text_splitter: Optional[TextSplitter] = None) List[Document] ¶
加载文档并将其分割成块。块将以文档的形式返回。
请勿重写此方法。应考虑将其弃用!
- 参数
text_splitter (可选[TextSplitter]) – 用于分割文档的TextSplitter实例。默认为RecursiveCharacterTextSplitter。
- 返回
文档列表。
- 返回类型
列表[Document]