langchain_community.document_loaders.max_compute.MaxComputeLoader
class langchain_community.document_loaders.max_compute.MaxComputeLoader(query: str, api_wrapper: MaxComputeAPIWrapper, *, page_content_columns: Optional[Sequence[str]] = None, metadata_columns: Optional[Sequence[str]] = None)[source]

阿里云MaxCompute 表中加载数据。

初始化阿里云MaxCompute文档加载器。

参数
  • query (str) – 要执行的SQL查询。

  • api_wrapper (MaxComputeAPIWrapper) – MaxCompute API包装器。

  • page_content_columns (Optional[Sequence[str]]) – 写入文档的 page_content 的列。如果未指定,所有列都将写入到 page_content

  • metadata_columns (Optional[Sequence[str]]) – 写入文档的 metadata 的列。如果未指定,所有未添加到 page_content 的列都将写入。

方法

__init__(query, api_wrapper, *[, ...])

初始化阿里云MaxCompute文档加载器。

alazy_load()

Documents的懒加载器。

aload()

将数据加载到Document对象中。

from_params(query, endpoint, project, *[, ...])

方便的构造函数,从

lazy_load()

Documents的懒加载器。

load()

将数据加载到Document对象中。

load_and_split([text_splitter])

加载Documents并将其分割成块。

__init__(query: str, api_wrapper: MaxComputeAPIWrapper, *, page_content_columns: Optional[Sequence[str]] = None, metadata_columns: Optional[Sequence[str]] = None)[源代码]

初始化阿里云MaxCompute文档加载器。

参数
  • query (str) – 要执行的SQL查询。

  • api_wrapper (MaxComputeAPIWrapper) – MaxCompute API包装器。

  • page_content_columns (Optional[Sequence[str]]) – 写入文档的 page_content 的列。如果未指定,所有列都将写入到 page_content

  • metadata_columns (Optional[Sequence[str]]) – 写入文档的 metadata 的列。如果未指定,所有未添加到 page_content 的列都将写入。

async alazy_load() AsyncIterator[Document]

Documents的懒加载器。

返回类型

AsyncIterator[Document]

async aload() List[Document]

将数据加载到Document对象中。

返回类型

[Document]

类方法 from_params(query: str, endpoint: str, project: str, *, access_id: Optional[str] = None, secret_access_key: Optional[str] = None, **kwargs: Any) MaxComputeLoader[source]
方便的构造函数,从

传入参数。

参数
  • query (str) – 要执行的SQL查询。

  • endpoint (str) – MaxCompute 端点。

  • project (str) – 项目是 MaxCompute 的基本组织单元,类似于数据库。

  • access_id (Optional[str]) – MaxCompute 访问 ID。可以直接传入或设置环境变量 MAX_COMPUTE_ACCESS_ID

  • secret_access_key (Optional[str]) – MaxCompute 密钥访问密钥。可以直接传入或设置环境变量 MAX_COMPUTE_SECRET_ACCESS_KEY

  • kwargs (Any) –

返回类型

MaxComputeLoader

lazy_load() Iterator[Document][source]

Documents的懒加载器。

返回类型

Iterator[Document]

load() List[Document]

将数据加载到Document对象中。

返回类型

[Document]

load_and_split(text_splitter: Optional[TextSplitter] = None) List[Document]

加载文档并将其分割成块。块以文档的形式返回。

不要覆盖此方法。它应被视为已过时!

参数

text_splitter (可选TextSplitter) – 用于分割文档的TextSplitter实例。默认为RecursiveCharacterTextSplitter。

返回

文档列表。

返回类型

List[Document]

使用MaxComputeLoader的示例