langchain_experimental.graph_transformers.gliner.GlinerGraphTransformer

langchain_experimental.graph_transformers.gliner.GlinerGraphTransformer(allowed_nodes: List[str], allowed_relationships: Union[List[str], Dict[str, Any]], gliner_model: str = 'urchade/gliner_mediumv2.1', glirel_model: str = 'jackboyla/glirel_beta', entity_confidence_threshold: float = 0.1, relationship_confidence_threshold: float = 0.1, device: str = 'cpu', ignore_self_loops: bool = True)[源代码]

使用GLiNER和GLiREL模型将文档转换为图结构的transformer类。

该类利用GLiNER从文本文档中进行命名实体识别,GLiREL进行关系提取,并将其转换为图格式。提取的实体和关系根据指定的置信阈值和允许的类型进行过滤。

有关GLiNER和GLiREL的更多信息,请访问它们各自的存储库

GLiNER: https://github.com/urchade/GLiNER GLiREL: https://github.com/jackboyla/GLiREL/tree/main

参数
  • allowed_nodes (列表[字符串]) – 允许的节点类型列表,用于实体提取。

  • allowed_relationships (并集[列表[字符串], 字典[字符串, Any]]) – 允许的关系类型列表或用于关系提取的带有额外配置的字典。

  • gliner_model (字符串) – 要使用的预训练GLiNER模型名称。默认是“urchade/gliner_mediumv2.1”。

  • glirel_model (字符串) – 要使用的预训练GLiREL模型名称。默认是“jackboyla/glirel_beta”。

  • entity_confidence_threshold (浮点数) - 过滤提取实体的置信度阈值。默认值为0.1。

  • relationship_confidence_threshold (浮点数) - 过滤提取关系的置信度阈值。默认值为0.1。

  • device (字符串) - 用于模型推理的设备(“cpu”或“cuda”)。默认为“cpu”。

  • ignore_self_loops (布尔值) - 是否忽略源节点和目标节点相同的边。默认为True。

方法

__init__(allowed_nodes, allowed_relationships)

convert_to_graph_documents(documents)

将一系列文档转换为图文档。

process_document(document)

__init__(allowed_nodes: List[str], allowed_relationships: Union[List[str], Dict[str, Any], gliner_model: str = 'urchade/gliner_mediumv2.1', glirel_model: str = 'jackboyla/glirel_beta', entity_confidence_threshold: float = 0.1, relationship_confidence_threshold: float = 0.1, device: str = 'cpu', ignore_self_loops: bool = True) None[source]
参数
  • allowed_nodes (列表[字符串]) –

  • allowed_relationships (联合[列表[字符串], 字典[字符串, 任何]]) –

  • gliner_model (字符串) –

  • glirel_model (字符串) –

  • entity_confidence_threshold (浮点数) –

  • relationship_confidence_threshold (浮点数) –

  • device (字符串) –

  • ignore_self_loops (布尔值) –

返回类型

convert_to_graph_documents(documents: Sequence[Document]) List[GraphDocument][source]

将一系列文档转换为图文档。

参数
  • documents (Sequence[Document]) – 原始文档。

  • kwargs – 额外关键字参数。

返回:

将变换后的文档作为图。

返回类型

Sequence[GraphDocument]

process_document(document: Document) GraphDocument[source]
参数

document (Document) –

返回类型

GraphDocument