langchain_community.embeddings.laser.LaserEmbeddings

class langchain_community.embeddings.laser.LaserEmbeddings[source]

基础:BaseModelEmbeddings

LASER无语言限制的句子表示。LASER是Meta AI研究团队开发的Python库,截至2024年2月25日,已用于创建147种语言的跨语言句子嵌入。更多文档请参阅:* https://github.com/facebookresearch/LASER/ * https://github.com/facebookresearch/LASER/tree/main/laser_encoders * https://arxiv.org/abs/2205.12654

要使用此类,您必须安装laser_encoders Python包。

pip install laser_encoders .. 案例说明

from laser_encoders import LaserEncoderPipeline
encoder = LaserEncoderPipeline(lang="eng_Latn")
embeddings = encoder.encode_sentences(["Hello", "World"])

通过解析和验证关键字参数中的输入数据创建新模型。

如果输入数据无法解析以形成有效的模型,则引发ValidationError异常。

param lang: Optional[str] = None

要使用的语言或语言代码。如果为空,此实现将默认使用早期的多语言LASER编码器模型(称为laser2)。支持的语言列表请参阅:https://github.com/facebookresearch/flores/blob/main/flores200/README.md#languages-in-flores-200

async aembed_documents(texts: List[str]) List[List[float]]

异步嵌入文档。

参数

texts (List[str]) – 需要嵌入的文本列表。

返回

嵌入列表。

返回类型

List[List[float]]

async aembed_query(text: str) List[float]

异步嵌入查询文本。

参数

text (str) – 要嵌入的文本。

返回

嵌入。

返回类型

List[float]

embed_documents(texts: List[str]) List[List[float]][source]

使用LASER为文档生成嵌入。

参数

texts (List[str]) – 要嵌入的文本列表。

返回

嵌入列表,每个文本一个。

返回类型

List[List[float]]

embed_query(text: str) List[float][source]

使用LASER为单个查询文本生成嵌入。

参数

text (str) – 要嵌入的文本。

返回

文本的嵌入。

返回类型

List[float]

激光嵌入示例使用