`langchain_google_community.gcs_file`.GCSFileLoader¶

class langchain_google_community.gcs_file.GCSFileLoader(project_name: str, bucket: str, blob: str, loader_func: Optional[Callable[[str], BaseLoader]] = None)[source]¶

从GCS文件加载数据。

使用存储桶和密钥名称初始化。

参数

project_name (str) – 加载的项目名称
bucket (str) – GCS桶的名称。
blob (str) – 要加载的GCS blob名称。
loader_func (Optional[Callable[[str], BaseLoader]]) – 一个加载函数，根据文件路径参数实例化加载器。如果不提供任何内容，则使用UnstructuredFileLoader。

示例

使用替代PDF加载器：>> from langchain_community.document_loaders import PyPDFLoader >> loader = GCSFileLoader(…, loader_func=PyPDFLoader)

使用带有附加参数的UnstructuredFileLoader：>> loader = GCSFileLoader(…, >> loader_func=lambda x: UnstructuredFileLoader(x, mode="elements"))

方法

`__init__`(project_name, bucket, blob[, ...])	使用存储桶和密钥名称初始化。
`alazy_load`()	Documents的懒加载器。
`aload`()	将数据加载到Document对象中。
`lazy_load`()	Documents的懒加载器。
`load`()	加载数据。
`load_and_split`([text_splitter])	加载数据并分割成块。

__init__(project_name: str, bucket: str, blob: str, loader_func: Optional[Callable[[str], BaseLoader]] = None)[源代码]¶

使用存储桶和密钥名称初始化。

参数

project_name (str) – 加载的项目名称
bucket (str) – GCS桶的名称。
blob (str) – 要加载的GCS blob名称。
loader_func (Optional[Callable[[str], BaseLoader]]) – 一个加载函数，根据文件路径参数实例化加载器。如果不提供任何内容，则使用UnstructuredFileLoader。

示例

使用替代PDF加载器：>> from langchain_community.document_loaders import PyPDFLoader >> loader = GCSFileLoader(…, loader_func=PyPDFLoader)

使用带有附加参数的UnstructuredFileLoader：>> loader = GCSFileLoader(…, >> loader_func=lambda x: UnstructuredFileLoader(x, mode="elements"))

async alazy_load() → AsyncIterator[Document]¶

Documents的懒加载器。

返回类型: AsyncIterator[Document]

async aload() → List[Document]¶

将数据加载到Document对象中。

返回类型: List[Document]

lazy_load() → Iterator[Document]¶

Documents的懒加载器。

返回类型: Iterator[Document]

load() → List[Document][源代码]¶

加载数据。

返回类型: List[Document]

load_and_split(text_splitter: Optional[TextSplitter] = None) → List[Document]¶

加载文档并分割为块。块作为文档返回。

不要重写此方法。应考虑将其弃用！

参数: text_splitter (可选：TextSplitter）- 要用于分割文档的 TextSplitter 实例。默认为 RecursiveCharacterTextSplitter。
返回: 文档列表。
返回类型: 列表[Document]

langchain_google_community.gcs_file.GCSFileLoader¶

`langchain_google_community.gcs_file`.GCSFileLoader¶