langchain_elasticsearch.embeddings
.ElasticsearchEmbeddings¶
- class langchain_elasticsearch.embeddings.ElasticsearchEmbeddings(client: MlClient, model_id: str, *, input_field: str = 'text_field')[source]¶
Elasticsearch 嵌入模型。
此类提供了一个接口,用于使用部署在 Elasticsearch 集群中的模型生成嵌入。它需要 Elasticsearch 连接对象和部署在集群中的模型的 model_id。
在 Elasticsearch 中,您需要加载和部署嵌入模型。 - https://elastic.ac.cn/guide/en/elasticsearch/reference/current/infer-trained-model.html - https://elastic.ac.cn/guide/en/machine-learning/current/ml-nlp-deploy-models.html
初始化 ElasticsearchEmbeddings 实例。
- 参数
client (MlClient) – Elasticsearch ML 客户端对象。
model_id (str) – 部署在 Elasticsearch 集群中的模型的 model_id。
input_field (str) – 文档中输入文本字段的键名。默认为 ‘text_field’。
方法
__init__
(client, model_id, *[, input_field])初始化 ElasticsearchEmbeddings 实例。
aembed_documents
(texts)异步嵌入搜索文档。
aembed_query
(text)异步嵌入查询文本。
embed_documents
(texts)为文档列表生成嵌入。
embed_query
(text)为单个查询文本生成嵌入。
from_credentials
(model_id, *[, es_cloud_id, ...])从 Elasticsearch 凭据实例化嵌入。
from_es_connection
(model_id, es_connection)从现有的 Elasticsearch 连接实例化嵌入。
- __init__(client: MlClient, model_id: str, *, input_field: str = 'text_field')[source]¶
初始化 ElasticsearchEmbeddings 实例。
- 参数
client (MlClient) – Elasticsearch ML 客户端对象。
model_id (str) – 部署在 Elasticsearch 集群中的模型的 model_id。
input_field (str) – 文档中输入文本字段的键名。默认为 ‘text_field’。
- async aembed_documents(texts: List[str]) List[List[float]] ¶
异步嵌入搜索文档。
- 参数
texts (List[str]) – 要嵌入的文本列表。
- 返回值
嵌入列表。
- 返回类型
List[List[float]]
- async aembed_query(text: str) List[float] ¶
异步嵌入查询文本。
- 参数
text (str) – 要嵌入的文本。
- 返回值
嵌入。
- 返回类型
List[float]
- embed_documents(texts: List[str]) List[List[float]] [source]¶
为文档列表生成嵌入。
- 参数
texts (List[str]) – 用于生成嵌入的文档文本字符串列表。
- 返回值
- 嵌入列表,输入列表中的每个文档对应一个嵌入。
列表。
- 返回类型
List[List[float]]
- embed_query(text: str) List[float] [source]¶
为单个查询文本生成嵌入。
- 参数
text (str) – 用于生成嵌入的查询文本。
- 返回值
输入查询文本的嵌入。
- 返回类型
List[float]
- classmethod from_credentials(model_id: str, *, es_cloud_id: Optional[str] = None, es_api_key: Optional[str] = None, input_field: str = 'text_field') ElasticsearchEmbeddings [source]¶
从 Elasticsearch 凭据实例化嵌入。
- 参数
model_id (str) – 部署在 Elasticsearch 集群中的模型的 model_id。
input_field (str) – 文档中输入文本字段的键名。默认为 ‘text_field’。
es_cloud_id (Optional[str]) – (str, optional): 要连接的 Elasticsearch 云 ID。
es_user – (str, optional): Elasticsearch 用户名。
es_password – (str, optional): Elasticsearch 密码。
es_api_key (Optional[str]) –
- 返回类型
示例
from langchain_elasticserach.embeddings import ElasticsearchEmbeddings # Define the model ID and input field name (if different from default) model_id = "your_model_id" # Optional, only if different from 'text_field' input_field = "your_input_field" # Credentials can be passed in two ways. Either set the env vars # ES_CLOUD_ID, ES_USER, ES_PASSWORD and they will be automatically # pulled in, or pass them in directly as kwargs. embeddings = ElasticsearchEmbeddings.from_credentials( model_id, input_field=input_field, # es_cloud_id="foo", # es_user="bar", # es_password="baz", ) documents = [ "This is an example document.", "Another example document to generate embeddings for.", ] embeddings_generator.embed_documents(documents)
- classmethod from_es_connection(model_id: str, es_connection: Elasticsearch, input_field: str = 'text_field') ElasticsearchEmbeddings [source]¶
从现有的 Elasticsearch 连接实例化嵌入。
此方法提供了一种使用现有 Elasticsearch 连接创建 ElasticsearchEmbeddings 类实例的方法。连接对象用于创建 MlClient,然后 MlClient 用于初始化 ElasticsearchEmbeddings 实例。
Args: model_id (str): 部署在 Elasticsearch 集群中的模型的 model_id。 es_connection (elasticsearch.Elasticsearch): 现有的 Elasticsearch 连接对象。 input_field (str, optional): 文档中输入文本字段的键名。默认为 ‘text_field’。
Returns: ElasticsearchEmbeddings: ElasticsearchEmbeddings 类的实例。
示例
from elasticsearch import Elasticsearch from langchain_elasticsearch.embeddings import ElasticsearchEmbeddings # Define the model ID and input field name (if different from default) model_id = "your_model_id" # Optional, only if different from 'text_field' input_field = "your_input_field" # Create Elasticsearch connection es_connection = Elasticsearch( hosts=["localhost:9200"], http_auth=("user", "password") ) # Instantiate ElasticsearchEmbeddings using the existing connection embeddings = ElasticsearchEmbeddings.from_es_connection( model_id, es_connection, input_field=input_field, ) documents = [ "This is an example document.", "Another example document to generate embeddings for.", ] embeddings_generator.embed_documents(documents)
- 参数
model_id (str) –
es_connection (Elasticsearch) –
input_field (str) –
- 返回类型