langchain_google_vertexai.embeddings
.VertexAIEmbeddings¶
- class langchain_google_vertexai.embeddings.VertexAIEmbeddings[source]¶
基类:
_VertexAICommon
,Embeddings
Google Cloud VertexAI 嵌入模型。
初始化 sentence_transformer。
- param additional_headers: Optional[Dict[str, str]] = None¶
一个键值字典,表示模型调用的附加标头
- param api_endpoint: Optional[str] = None (别名 'base_url')¶
所需的 API 端点,例如 us-central1-aiplatform.googleapis.com
- param api_transport: Optional[str] = None¶
所需的 API 传输方法,可以是 ‘grpc’ 或 ‘rest’。如果已定义,则使用 vertexai.init 中的默认参数。
- param client_cert_source: Optional[Callable[[], Tuple[bytes, bytes]]] = None¶
一个回调函数,返回客户端证书字节和私钥字节
- param credentials: Any = None¶
要使用的默认自定义凭据 (google.auth.credentials.Credentials)
- param full_model_name: Optional[str] = None¶
模型端点的完整名称。
- param location: str = 'us-central1'¶
进行 API 调用时使用的默认位置。
- param max_output_tokens: Optional[int] = None (别名 'max_tokens')¶
令牌限制决定了一个提示的最大文本输出量。
- param max_retries: int = 6¶
生成时进行的最大重试次数。
- param model_name: str = None (别名 'model')¶
底层模型名称。
- param n: int = 1¶
为每个提示生成多少个补全。
- param project: Optional[str] = None¶
进行 Vertex API 调用时使用的默认 GCP 项目。
- param request_parallelism: int = 5¶
允许向 VertexAI 模型发出的请求的并行量。
- param safety_settings: Optional['SafetySettingsType'] = None¶
用于所有生成的默认安全设置。
例如
from langchain_google_vertexai import HarmBlockThreshold, HarmCategory
- safety_settings = {
HarmCategory.HARM_CATEGORY_UNSPECIFIED: HarmBlockThreshold.BLOCK_NONE, HarmCategory.HARM_CATEGORY_DANGEROUS_CONTENT: HarmBlockThreshold.BLOCK_MEDIUM_AND_ABOVE, HarmCategory.HARM_CATEGORY_HATE_SPEECH: HarmBlockThreshold.BLOCK_ONLY_HIGH, HarmCategory.HARM_CATEGORY_HARASSMENT: HarmBlockThreshold.BLOCK_LOW_AND_ABOVE, HarmCategory.HARM_CATEGORY_SEXUALLY_EXPLICIT: HarmBlockThreshold.BLOCK_NONE,
}
- param stop: Optional[List[str]] = None (别名 'stop_sequences')¶
生成时使用的可选停止词列表。
- param streaming: bool = False¶
是否流式传输结果。
- param temperature: Optional[float] = None¶
采样温度,它控制令牌选择中随机性的程度。
- param top_k: Optional[int] = None¶
模型如何选择令牌进行输出,下一个令牌从以下项中选择
- param top_p: Optional[float] = None¶
令牌从最有可能到最不可能的顺序选择,直到它们的总和
- param tuned_model_name: Optional[str] = None¶
已调优模型的名称。如果传递了 tuned_model_name,则 model_name 将用于确定模型系列
- async aembed_documents(texts: List[str]) List[List[float]] ¶
异步嵌入搜索文档。
- 参数
texts (List[str]) – 要嵌入的文本列表。
- 返回
嵌入列表。
- 返回类型
List[List[float]]
- async aembed_query(text: str) List[float] ¶
异步嵌入查询文本。
- 参数
text (str) – 要嵌入的文本。
- 返回
嵌入。
- 返回类型
List[float]
- embed(texts: List[str], batch_size: int = 0, embeddings_task_type: Optional[Literal['RETRIEVAL_QUERY', 'RETRIEVAL_DOCUMENT', 'SEMANTIC_SIMILARITY', 'CLASSIFICATION', 'CLUSTERING', 'QUESTION_ANSWERING', 'FACT_VERIFICATION']] = None, dimensions: Optional[int] = None) List[List[float]] [source]¶
嵌入字符串列表。
- 参数
texts (List[str]) – List[str] 要嵌入的字符串列表。
batch_size (int) – [int] 发送到模型的嵌入的批次大小。如果为零,则将在第一次请求时动态检测最大批次大小,从 250 开始,降至 5。
embeddings_task_type (Optional[Literal['RETRIEVAL_QUERY', 'RETRIEVAL_DOCUMENT', 'SEMANTIC_SIMILARITY', 'CLASSIFICATION', 'CLUSTERING', 'QUESTION_ANSWERING', 'FACT_VERIFICATION']]) –
[str] 可选的嵌入任务类型,以下之一
- RETRIEVAL_QUERY - 文本是查询
在搜索/检索设置中。
- RETRIEVAL_DOCUMENT - 文本是文档
在搜索/检索设置中。
- SEMANTIC_SIMILARITY - 嵌入将用于
语义文本相似度 (STS)。
CLASSIFICATION - 嵌入将用于分类。CLUSTERING - 嵌入将用于聚类。以下仅在预览模型上受支持:QUESTION_ANSWERING FACT_VERIFICATION
dimensions (Optional[int]) – [int] 可选。输出嵌入维度。仅在预览模型上受支持。
- 返回
嵌入列表,每个文本对应一个。
- 返回类型
List[List[float]]
- embed_documents(texts: List[str], batch_size: int = 0) List[List[float]] [source]¶
嵌入文档列表。
- 参数
texts (List[str]) – List[str] 要嵌入的文本列表。
batch_size (int) – [int] 发送到模型的嵌入的批次大小。如果为零,则将在第一次请求时动态检测最大批次大小,从 250 开始,降至 5。
- 返回
嵌入列表,每个文本对应一个。
- 返回类型
List[List[float]]
- embed_image(image_path: str, contextual_text: Optional[str] = None) List[float] [source]¶
嵌入图像。
- 参数
image_path (str) – 生成嵌入的图像路径(本地、Google Cloud Storage 或 Web)
for. (embeddings) –
contextual_text (Optional[str]) – 用于生成嵌入的文本。
- 返回
图像的嵌入。
- 返回类型
List[float]
- embed_query(text: str) List[float] [source]¶
嵌入文本。
- 参数
text (str) – 要嵌入的文本。
- 返回
文本的嵌入。
- 返回类型
List[float]
- get_num_tokens(text: str) int ¶
获取文本中存在的令牌数量。
用于检查输入是否适合模型的上下文窗口。
- 参数
text (str) – 要标记化的字符串输入。
- 返回
文本中令牌的整数数量。
- 返回类型
int
- property async_prediction_client: PredictionServiceAsyncClient¶
返回 PredictionServiceClient。
- property model_type: str¶
- property model_version: GoogleEmbeddingModelVersion¶
- property prediction_client: PredictionServiceClient¶
返回 PredictionServiceClient。
- task_executor: ClassVar[Optional[Executor]] = FieldInfo(exclude=True, extra={})¶