`langchain_google_vertexai.embeddings`.VertexAIEmbeddings¶

class langchain_google_vertexai.embeddings.VertexAIEmbeddings[source]¶

基类： _VertexAICommon, Embeddings

Google Cloud VertexAI 嵌入模型。

初始化 sentence_transformer。

param additional_headers: Optional[Dict[str, str]] = None¶: 一个键值字典，表示模型调用的附加标头

param api_endpoint: Optional[str] = None (别名 'base_url')¶: 所需的 API 端点，例如 us-central1-aiplatform.googleapis.com

param api_transport: Optional[str] = None¶: 所需的 API 传输方法，可以是 ‘grpc’ 或 ‘rest’。如果已定义，则使用 vertexai.init 中的默认参数。

param client_cert_source: Optional[Callable[[], Tuple[bytes, bytes]]] = None¶: 一个回调函数，返回客户端证书字节和私钥字节

param credentials: Any = None¶: 要使用的默认自定义凭据 (google.auth.credentials.Credentials)

param full_model_name: Optional[str] = None¶: 模型端点的完整名称。

param location: str = 'us-central1'¶: 进行 API 调用时使用的默认位置。

param max_output_tokens: Optional[int] = None (别名 'max_tokens')¶: 令牌限制决定了一个提示的最大文本输出量。

param max_retries: int = 6¶: 生成时进行的最大重试次数。

param model_name: str = None (别名 'model')¶: 底层模型名称。

param n: int = 1¶: 为每个提示生成多少个补全。

param project: Optional[str] = None¶: 进行 Vertex API 调用时使用的默认 GCP 项目。

param request_parallelism: int = 5¶: 允许向 VertexAI 模型发出的请求的并行量。

param safety_settings: Optional['SafetySettingsType'] = None¶

用于所有生成的默认安全设置。

例如

from langchain_google_vertexai import HarmBlockThreshold, HarmCategory

safety_settings = {
HarmCategory.HARM_CATEGORY_UNSPECIFIED: HarmBlockThreshold.BLOCK_NONE, HarmCategory.HARM_CATEGORY_DANGEROUS_CONTENT: HarmBlockThreshold.BLOCK_MEDIUM_AND_ABOVE, HarmCategory.HARM_CATEGORY_HATE_SPEECH: HarmBlockThreshold.BLOCK_ONLY_HIGH, HarmCategory.HARM_CATEGORY_HARASSMENT: HarmBlockThreshold.BLOCK_LOW_AND_ABOVE, HarmCategory.HARM_CATEGORY_SEXUALLY_EXPLICIT: HarmBlockThreshold.BLOCK_NONE,

}

param stop: Optional[List[str]] = None (别名 'stop_sequences')¶: 生成时使用的可选停止词列表。

param streaming: bool = False¶: 是否流式传输结果。

param temperature: Optional[float] = None¶: 采样温度，它控制令牌选择中随机性的程度。

param top_k: Optional[int] = None¶: 模型如何选择令牌进行输出，下一个令牌从以下项中选择

param top_p: Optional[float] = None¶: 令牌从最有可能到最不可能的顺序选择，直到它们的总和

param tuned_model_name: Optional[str] = None¶: 已调优模型的名称。如果传递了 tuned_model_name，则 model_name 将用于确定模型系列

async aembed_documents(texts: List[str]) → List[List[float]]¶

异步嵌入搜索文档。

参数: texts (List[str]) – 要嵌入的文本列表。
返回: 嵌入列表。
返回类型: List[List[float]]

async aembed_query(text: str) → List[float]¶

异步嵌入查询文本。

参数: text (str) – 要嵌入的文本。
返回: 嵌入。
返回类型: List[float]

embed(texts: List[str], batch_size: int = 0, embeddings_task_type: Optional[Literal['RETRIEVAL_QUERY', 'RETRIEVAL_DOCUMENT', 'SEMANTIC_SIMILARITY', 'CLASSIFICATION', 'CLUSTERING', 'QUESTION_ANSWERING', 'FACT_VERIFICATION']] = None, dimensions: Optional[int] = None) → List[List[float]][source]¶

嵌入字符串列表。

参数

texts (List[str]) – List[str] 要嵌入的字符串列表。
batch_size (int) – [int] 发送到模型的嵌入的批次大小。如果为零，则将在第一次请求时动态检测最大批次大小，从 250 开始，降至 5。
embeddings_task_type (Optional[Literal['RETRIEVAL_QUERY', 'RETRIEVAL_DOCUMENT', 'SEMANTIC_SIMILARITY', 'CLASSIFICATION', 'CLUSTERING', 'QUESTION_ANSWERING', 'FACT_VERIFICATION']]) –
[str] 可选的嵌入任务类型，以下之一

RETRIEVAL_QUERY - 文本是查询
在搜索/检索设置中。

RETRIEVAL_DOCUMENT - 文本是文档
在搜索/检索设置中。

SEMANTIC_SIMILARITY - 嵌入将用于
语义文本相似度 (STS)。

CLASSIFICATION - 嵌入将用于分类。CLUSTERING - 嵌入将用于聚类。以下仅在预览模型上受支持：QUESTION_ANSWERING FACT_VERIFICATION
dimensions (Optional[int]) – [int] 可选。输出嵌入维度。仅在预览模型上受支持。

返回

嵌入列表，每个文本对应一个。

返回类型

List[List[float]]

embed_documents(texts: List[str], batch_size: int = 0) → List[List[float]][source]¶

嵌入文档列表。

参数

texts (List[str]) – List[str] 要嵌入的文本列表。
batch_size (int) – [int] 发送到模型的嵌入的批次大小。如果为零，则将在第一次请求时动态检测最大批次大小，从 250 开始，降至 5。

返回

嵌入列表，每个文本对应一个。

返回类型

List[List[float]]

embed_image(image_path: str, contextual_text: Optional[str] = None) → List[float][source]¶

嵌入图像。

参数

image_path (str) – 生成嵌入的图像路径（本地、Google Cloud Storage 或 Web）
for. (embeddings) –
contextual_text (Optional[str]) – 用于生成嵌入的文本。

返回

图像的嵌入。

返回类型

List[float]

embed_query(text: str) → List[float][source]¶

嵌入文本。

参数: text (str) – 要嵌入的文本。
返回: 文本的嵌入。
返回类型: List[float]

get_num_tokens(text: str) → int¶

获取文本中存在的令牌数量。

用于检查输入是否适合模型的上下文窗口。

参数: text (str) – 要标记化的字符串输入。
返回: 文本中令牌的整数数量。
返回类型: int

property async_prediction_client: PredictionServiceAsyncClient¶: 返回 PredictionServiceClient。

property model_type: str¶

property model_version: GoogleEmbeddingModelVersion¶

property prediction_client: PredictionServiceClient¶: 返回 PredictionServiceClient。

task_executor: ClassVar[Optional[Executor]] = FieldInfo(exclude=True, extra={})¶

使用 VertexAIEmbeddings 的示例¶

langchain_google_vertexai.embeddings.VertexAIEmbeddings¶

使用 VertexAIEmbeddings 的示例¶

`langchain_google_vertexai.embeddings`.VertexAIEmbeddings¶