langchain_google_vertexai.embeddings.VertexAIEmbeddings¶
- class langchain_google_vertexai.embeddings.VertexAIEmbeddings[source]¶
- 基类: - _VertexAICommon,- Embeddings- Google Cloud VertexAI 嵌入模型。 - 初始化 sentence_transformer。 - param additional_headers: Optional[Dict[str, str]] = None¶
- 一个键值字典,表示模型调用的附加标头 
 - param api_endpoint: Optional[str] = None (别名 'base_url')¶
- 所需的 API 端点,例如 us-central1-aiplatform.googleapis.com 
 - param api_transport: Optional[str] = None¶
- 所需的 API 传输方法,可以是 ‘grpc’ 或 ‘rest’。如果已定义,则使用 vertexai.init 中的默认参数。 
 - param client_cert_source: Optional[Callable[[], Tuple[bytes, bytes]]] = None¶
- 一个回调函数,返回客户端证书字节和私钥字节 
 - param credentials: Any = None¶
- 要使用的默认自定义凭据 (google.auth.credentials.Credentials) 
 - param full_model_name: Optional[str] = None¶
- 模型端点的完整名称。 
 - param location: str = 'us-central1'¶
- 进行 API 调用时使用的默认位置。 
 - param max_output_tokens: Optional[int] = None (别名 'max_tokens')¶
- 令牌限制决定了一个提示的最大文本输出量。 
 - param max_retries: int = 6¶
- 生成时进行的最大重试次数。 
 - param model_name: str = None (别名 'model')¶
- 底层模型名称。 
 - param n: int = 1¶
- 为每个提示生成多少个补全。 
 - param project: Optional[str] = None¶
- 进行 Vertex API 调用时使用的默认 GCP 项目。 
 - param request_parallelism: int = 5¶
- 允许向 VertexAI 模型发出的请求的并行量。 
 - param safety_settings: Optional['SafetySettingsType'] = None¶
- 用于所有生成的默认安全设置。 - 例如 - from langchain_google_vertexai import HarmBlockThreshold, HarmCategory - safety_settings = {
- HarmCategory.HARM_CATEGORY_UNSPECIFIED: HarmBlockThreshold.BLOCK_NONE, HarmCategory.HARM_CATEGORY_DANGEROUS_CONTENT: HarmBlockThreshold.BLOCK_MEDIUM_AND_ABOVE, HarmCategory.HARM_CATEGORY_HATE_SPEECH: HarmBlockThreshold.BLOCK_ONLY_HIGH, HarmCategory.HARM_CATEGORY_HARASSMENT: HarmBlockThreshold.BLOCK_LOW_AND_ABOVE, HarmCategory.HARM_CATEGORY_SEXUALLY_EXPLICIT: HarmBlockThreshold.BLOCK_NONE, 
 - } 
 - param stop: Optional[List[str]] = None (别名 'stop_sequences')¶
- 生成时使用的可选停止词列表。 
 - param streaming: bool = False¶
- 是否流式传输结果。 
 - param temperature: Optional[float] = None¶
- 采样温度,它控制令牌选择中随机性的程度。 
 - param top_k: Optional[int] = None¶
- 模型如何选择令牌进行输出,下一个令牌从以下项中选择 
 - param top_p: Optional[float] = None¶
- 令牌从最有可能到最不可能的顺序选择,直到它们的总和 
 - param tuned_model_name: Optional[str] = None¶
- 已调优模型的名称。如果传递了 tuned_model_name,则 model_name 将用于确定模型系列 
 - async aembed_documents(texts: List[str]) List[List[float]]¶
- 异步嵌入搜索文档。 - 参数
- texts (List[str]) – 要嵌入的文本列表。 
- 返回
- 嵌入列表。 
- 返回类型
- List[List[float]] 
 
 - async aembed_query(text: str) List[float]¶
- 异步嵌入查询文本。 - 参数
- text (str) – 要嵌入的文本。 
- 返回
- 嵌入。 
- 返回类型
- List[float] 
 
 - embed(texts: List[str], batch_size: int = 0, embeddings_task_type: Optional[Literal['RETRIEVAL_QUERY', 'RETRIEVAL_DOCUMENT', 'SEMANTIC_SIMILARITY', 'CLASSIFICATION', 'CLUSTERING', 'QUESTION_ANSWERING', 'FACT_VERIFICATION']] = None, dimensions: Optional[int] = None) List[List[float]][source]¶
- 嵌入字符串列表。 - 参数
- texts (List[str]) – List[str] 要嵌入的字符串列表。 
- batch_size (int) – [int] 发送到模型的嵌入的批次大小。如果为零,则将在第一次请求时动态检测最大批次大小,从 250 开始,降至 5。 
- embeddings_task_type (Optional[Literal['RETRIEVAL_QUERY', 'RETRIEVAL_DOCUMENT', 'SEMANTIC_SIMILARITY', 'CLASSIFICATION', 'CLUSTERING', 'QUESTION_ANSWERING', 'FACT_VERIFICATION']]) – - [str] 可选的嵌入任务类型,以下之一 - RETRIEVAL_QUERY - 文本是查询
- 在搜索/检索设置中。 
- RETRIEVAL_DOCUMENT - 文本是文档
- 在搜索/检索设置中。 
- SEMANTIC_SIMILARITY - 嵌入将用于
- 语义文本相似度 (STS)。 
 - CLASSIFICATION - 嵌入将用于分类。CLUSTERING - 嵌入将用于聚类。以下仅在预览模型上受支持:QUESTION_ANSWERING FACT_VERIFICATION 
- dimensions (Optional[int]) – [int] 可选。输出嵌入维度。仅在预览模型上受支持。 
 
- 返回
- 嵌入列表,每个文本对应一个。 
- 返回类型
- List[List[float]] 
 
 - embed_documents(texts: List[str], batch_size: int = 0) List[List[float]][source]¶
- 嵌入文档列表。 - 参数
- texts (List[str]) – List[str] 要嵌入的文本列表。 
- batch_size (int) – [int] 发送到模型的嵌入的批次大小。如果为零,则将在第一次请求时动态检测最大批次大小,从 250 开始,降至 5。 
 
- 返回
- 嵌入列表,每个文本对应一个。 
- 返回类型
- List[List[float]] 
 
 - embed_image(image_path: str, contextual_text: Optional[str] = None) List[float][source]¶
- 嵌入图像。 - 参数
- image_path (str) – 生成嵌入的图像路径(本地、Google Cloud Storage 或 Web) 
- for. (embeddings) – 
- contextual_text (Optional[str]) – 用于生成嵌入的文本。 
 
- 返回
- 图像的嵌入。 
- 返回类型
- List[float] 
 
 - embed_query(text: str) List[float][source]¶
- 嵌入文本。 - 参数
- text (str) – 要嵌入的文本。 
- 返回
- 文本的嵌入。 
- 返回类型
- List[float] 
 
 - get_num_tokens(text: str) int¶
- 获取文本中存在的令牌数量。 - 用于检查输入是否适合模型的上下文窗口。 - 参数
- text (str) – 要标记化的字符串输入。 
- 返回
- 文本中令牌的整数数量。 
- 返回类型
- int 
 
 - property async_prediction_client: PredictionServiceAsyncClient¶
- 返回 PredictionServiceClient。 
 - property model_type: str¶
 - property model_version: GoogleEmbeddingModelVersion¶
 - property prediction_client: PredictionServiceClient¶
- 返回 PredictionServiceClient。 
 - task_executor: ClassVar[Optional[Executor]] = FieldInfo(exclude=True, extra={})¶