langchain_google_vertexai.vectorstores.document_storage
.GCSDocumentStorage¶
- class langchain_google_vertexai.vectorstores.document_storage.GCSDocumentStorage(bucket: Bucket, prefix: Optional[str] = 'documents', threaded=True, n_threads=8)[source]¶
在 Google Cloud Storage 中存储文档。对于每对 id、document_text,blob 的名称将是存储为纯文本格式的 {prefix}/{id}。
构造函数。 :param bucket: 文档将存储在的 Bucket。 :param prefix: 预先添加到所有文档名称的前缀。
方法
__init__
(bucket[, prefix, threaded, n_threads])构造函数。
amdelete
(keys)异步删除给定的键及其关联的值。
amget
(keys)异步获取与给定键关联的值。
amset
(key_value_pairs)异步设置给定键的值。
ayield_keys
(*[, prefix])异步获取与给定前缀匹配的键的迭代器。
mdelete
(keys)按 id 批量删除文档。
mget
(keys)按 id 批量获取文档。
mset
(key_value_pairs)使用每个键存储一系列文档
yield_keys
(*[, prefix])产生存储中存在的键。
- 参数
bucket (storage.Bucket) –
prefix (Optional[str]) –
- __init__(bucket: Bucket, prefix: Optional[str] = 'documents', threaded=True, n_threads=8) None [source]¶
构造函数。 :param bucket: 文档将存储在的 Bucket。 :param prefix: 预先添加到所有文档名称的前缀。
- 参数
bucket (Bucket) –
prefix (Optional[str]) –
- 返回类型
None
- async amdelete(keys: Sequence[K]) None ¶
异步删除给定的键及其关联的值。
- 参数
keys (Sequence[K]) – 要删除的键的序列。
- 返回类型
None
- async amget(keys: Sequence[K]) List[Optional[V]] ¶
异步获取与给定键关联的值。
- 参数
keys (Sequence[K]) – 键的序列。
- 返回
与键关联的可选值的序列。如果未找到键,则对应的值将为 None。
- 返回类型
List[Optional[V]]
- async amset(key_value_pairs: Sequence[Tuple[K, V]]) None ¶
异步设置给定键的值。
- 参数
key_value_pairs (Sequence[Tuple[K, V]]) – 键值对的序列。
- 返回类型
None
- async ayield_keys(*, prefix: Optional[str] = None) Union[AsyncIterator[K], AsyncIterator[str]] ¶
异步获取与给定前缀匹配的键的迭代器。
- 参数
prefix (str) – 要匹配的前缀。
- 产生
Iterator[K | str] – 匹配给定前缀的键的迭代器。此方法允许返回 K 或 str 的迭代器,具体取决于给定存储的哪种方式更有意义。
- 返回类型
Union[AsyncIterator[K], AsyncIterator[str]]
- mdelete(keys: Sequence[str]) None [source]¶
按 id 批量删除文档。
- 参数
keys (Sequence[str]) – 文本的 id 列表。
- 返回类型
None
- mget(keys: Sequence[str]) List[Optional[Document]] [source]¶
按 id 批量获取文档。默认实现仅循环 get_by_id。具有更快批量检索数据方式的子类应实现此方法。 :param ids: 文本的 id 列表。
- 返回
- 文档列表。如果对于任何 id 记录未找到键 id,则返回
而是 None。
- 参数
keys (Sequence[str]) –
- 返回类型
List[Optional[Document]]