langchain_community.document_loaders.max_compute
.MaxComputeLoader
class langchain_community.document_loaders.max_compute.MaxComputeLoader(query: str, api_wrapper: MaxComputeAPIWrapper, *, page_content_columns: Optional[Sequence[str]] = None, metadata_columns: Optional[Sequence[str]] = None)[source]¶
从 阿里云MaxCompute 表中加载数据。
初始化阿里云MaxCompute文档加载器。
- 参数
query (str) – 要执行的SQL查询。
api_wrapper (MaxComputeAPIWrapper) – MaxCompute API包装器。
page_content_columns (Optional[Sequence[str]]) – 写入文档的 page_content 的列。如果未指定,所有列都将写入到 page_content。
metadata_columns (Optional[Sequence[str]]) – 写入文档的 metadata 的列。如果未指定,所有未添加到 page_content 的列都将写入。
方法
__init__
(query, api_wrapper, *[, ...])
初始化阿里云MaxCompute文档加载器。
Documents的懒加载器。
aload
()
将数据加载到Document对象中。
from_params
(query, endpoint, project, *[, ...])
方便的构造函数,从
Documents的懒加载器。
load
()
将数据加载到Document对象中。
load_and_split
([text_splitter])
加载Documents并将其分割成块。
-
__init__(query: str, api_wrapper: MaxComputeAPIWrapper, *, page_content_columns: Optional[Sequence[str]] = None, metadata_columns: Optional[Sequence[str]] = None)[源代码]¶
初始化阿里云MaxCompute文档加载器。
- 参数
query (str) – 要执行的SQL查询。
api_wrapper (MaxComputeAPIWrapper) – MaxCompute API包装器。
page_content_columns (Optional[Sequence[str]]) – 写入文档的 page_content 的列。如果未指定,所有列都将写入到 page_content。
metadata_columns (Optional[Sequence[str]]) – 写入文档的 metadata 的列。如果未指定,所有未添加到 page_content 的列都将写入。
-
类方法 from_params(query: str, endpoint: str, project: str, *, access_id: Optional[str] = None, secret_access_key: Optional[str] = None, **kwargs: Any) MaxComputeLoader [source]¶
- 方便的构造函数,从
传入参数。
- 参数
query (str) – 要执行的SQL查询。
endpoint (str) – MaxCompute 端点。
project (str) – 项目是 MaxCompute 的基本组织单元,类似于数据库。
access_id (Optional[str]) – MaxCompute 访问 ID。可以直接传入或设置环境变量 MAX_COMPUTE_ACCESS_ID。
secret_access_key (Optional[str]) – MaxCompute 密钥访问密钥。可以直接传入或设置环境变量 MAX_COMPUTE_SECRET_ACCESS_KEY。
kwargs (Any) –
- 返回类型
-
-
load_and_split(text_splitter: Optional[TextSplitter] = None) List[Document] ¶
加载文档并将其分割成块。块以文档的形式返回。
不要覆盖此方法。它应被视为已过时!
- 参数
text_splitter (可选:TextSplitter) – 用于分割文档的TextSplitter实例。默认为RecursiveCharacterTextSplitter。
- 返回
文档列表。
- 返回类型
List[Document]
使用MaxComputeLoader的示例¶
从 阿里云MaxCompute 表中加载数据。
初始化阿里云MaxCompute文档加载器。
- 参数
query (str) – 要执行的SQL查询。
api_wrapper (MaxComputeAPIWrapper) – MaxCompute API包装器。
page_content_columns (Optional[Sequence[str]]) – 写入文档的 page_content 的列。如果未指定,所有列都将写入到 page_content。
metadata_columns (Optional[Sequence[str]]) – 写入文档的 metadata 的列。如果未指定,所有未添加到 page_content 的列都将写入。
方法
|
初始化阿里云MaxCompute文档加载器。 |
Documents的懒加载器。 |
|
|
将数据加载到Document对象中。 |
|
方便的构造函数,从 |
Documents的懒加载器。 |
|
|
将数据加载到Document对象中。 |
|
加载Documents并将其分割成块。 |
- __init__(query: str, api_wrapper: MaxComputeAPIWrapper, *, page_content_columns: Optional[Sequence[str]] = None, metadata_columns: Optional[Sequence[str]] = None)[源代码]¶
初始化阿里云MaxCompute文档加载器。
- 参数
query (str) – 要执行的SQL查询。
api_wrapper (MaxComputeAPIWrapper) – MaxCompute API包装器。
page_content_columns (Optional[Sequence[str]]) – 写入文档的 page_content 的列。如果未指定,所有列都将写入到 page_content。
metadata_columns (Optional[Sequence[str]]) – 写入文档的 metadata 的列。如果未指定,所有未添加到 page_content 的列都将写入。
- 类方法 from_params(query: str, endpoint: str, project: str, *, access_id: Optional[str] = None, secret_access_key: Optional[str] = None, **kwargs: Any) MaxComputeLoader [source]¶
- 方便的构造函数,从
传入参数。
- 参数
query (str) – 要执行的SQL查询。
endpoint (str) – MaxCompute 端点。
project (str) – 项目是 MaxCompute 的基本组织单元,类似于数据库。
access_id (Optional[str]) – MaxCompute 访问 ID。可以直接传入或设置环境变量 MAX_COMPUTE_ACCESS_ID。
secret_access_key (Optional[str]) – MaxCompute 密钥访问密钥。可以直接传入或设置环境变量 MAX_COMPUTE_SECRET_ACCESS_KEY。
kwargs (Any) –
- 返回类型
- load_and_split(text_splitter: Optional[TextSplitter] = None) List[Document] ¶
加载文档并将其分割成块。块以文档的形式返回。
不要覆盖此方法。它应被视为已过时!
- 参数
text_splitter (可选:TextSplitter) – 用于分割文档的TextSplitter实例。默认为RecursiveCharacterTextSplitter。
- 返回
文档列表。
- 返回类型
List[Document]