langchain_google_community.bigquery.BigQueryLoader

class langchain_google_community.bigquery.BigQueryLoader(query: str, project: Optional[str] = None, page_content_columns: Optional[List[str]] = None, metadata_columns: Optional[List[str]] = None, credentials: Optional[Credentials] = None)[source]

从谷歌云平台 BigQuery 加载。

每个文档表示结果中的一行。将 page_content_columns 写入文档的 page_content 中。将 metadata_columns 写入文档的 metadata 中。默认情况下,所有列都写入 page_content, none 写入到 metadata 中。

初始化 BigQuery 文档加载器。

参数
  • query (str) – 要在 BigQuery 中运行的查询。

  • project (Optional[str]) – 可选。运行查询的项目。

  • page_content_columns (Optional[List[str]]) – 可选。写入文档的 page_content 的列。

  • metadata_columns (Optional[List[str]]) – 可选。写入文档的 metadata 的列。

  • credentials (Optional[Credentials]) –

    google.auth.credentials.Credentials,可选,用于访问 Google API 的凭据。使用此参数可覆盖

    默认凭据,例如,直接使用 Compute Engine (google.auth.compute_engine.Credentials)或服务帐户(google.oauth2.service_account.Credentials)凭据。

方法

__init__(query[, project, ...])

初始化 BigQuery 文档加载器。

alazy_load()

Documents 的懒加载器。

aload()

将数据加载到 Document 对象中。

lazy_load()

Documents 的懒加载器。

load()

将数据加载到 Document 对象中。

load_and_split([text_splitter])

加载 Documents 并将其拆分为片段。

__init__(query: str, project: Optional[str] = None, page_content_columns: Optional[List[str]] = None, metadata_columns: Optional[List[str]] = None, credentials: Optional[Credentials] = None)[source]

初始化 BigQuery 文档加载器。

参数
  • query (str) – 要在 BigQuery 中运行的查询。

  • project (Optional[str]) – 可选。运行查询的项目。

  • page_content_columns (Optional[List[str]]) – 可选。写入文档的 page_content 的列。

  • metadata_columns (Optional[List[str]]) – 可选。写入文档的 metadata 的列。

  • credentials (Optional[Credentials]) –

    google.auth.credentials.Credentials,可选,用于访问 Google API 的凭据。使用此参数可覆盖

    默认凭据,例如,直接使用 Compute Engine (google.auth.compute_engine.Credentials)或服务帐户(google.oauth2.service_account.Credentials)凭据。

async alazy_load() AsyncIterator[Document]

Documents 的懒加载器。

返回类型

AsyncIterator[Document]

async aload() List[Document]

将数据加载到 Document 对象中。

返回类型

List[Document]

lazy_load() Iterator[Document]

Documents 的懒加载器。

返回类型

Iterator[Document]

load() List[Document][source]

将数据加载到 Document 对象中。

返回类型

List[Document]

load_and_split(text_splitter: Optional[TextSplitter] = None) List[Document]

加载文档并将其分割成块。块以文档的形式返回。

不要覆盖此方法。应考虑将其弃用!

参数

text_splitter(《可选》) - 用于分割文档的 TextSplitter 实例。默认为 RecursiveCharacterTextSplitter。

返回

文档列表。

返回类型

List[Document]