langchain_experimental.graph_transformers.gliner
.GlinerGraphTransformer¶
- 类 langchain_experimental.graph_transformers.gliner.GlinerGraphTransformer(allowed_nodes: List[str], allowed_relationships: Union[List[str], Dict[str, Any]], gliner_model: str = 'urchade/gliner_mediumv2.1', glirel_model: str = 'jackboyla/glirel_beta', entity_confidence_threshold: float = 0.1, relationship_confidence_threshold: float = 0.1, device: str = 'cpu', ignore_self_loops: bool = True)[源代码]¶
使用GLiNER和GLiREL模型将文档转换为图结构的transformer类。
该类利用GLiNER从文本文档中进行命名实体识别,GLiREL进行关系提取,并将其转换为图格式。提取的实体和关系根据指定的置信阈值和允许的类型进行过滤。
- 有关GLiNER和GLiREL的更多信息,请访问它们各自的存储库
GLiNER: https://github.com/urchade/GLiNER GLiREL: https://github.com/jackboyla/GLiREL/tree/main
- 参数
allowed_nodes (列表[字符串]) – 允许的节点类型列表,用于实体提取。
allowed_relationships (并集[列表[字符串], 字典[字符串, Any]]) – 允许的关系类型列表或用于关系提取的带有额外配置的字典。
gliner_model (字符串) – 要使用的预训练GLiNER模型名称。默认是“urchade/gliner_mediumv2.1”。
glirel_model (字符串) – 要使用的预训练GLiREL模型名称。默认是“jackboyla/glirel_beta”。
entity_confidence_threshold (浮点数) - 过滤提取实体的置信度阈值。默认值为0.1。
relationship_confidence_threshold (浮点数) - 过滤提取关系的置信度阈值。默认值为0.1。
device (字符串) - 用于模型推理的设备(“cpu”或“cuda”)。默认为“cpu”。
ignore_self_loops (布尔值) - 是否忽略源节点和目标节点相同的边。默认为True。
方法
__init__
(allowed_nodes, allowed_relationships)convert_to_graph_documents
(documents)将一系列文档转换为图文档。
process_document
(document)- __init__(allowed_nodes: List[str], allowed_relationships: Union[List[str], Dict[str, Any], gliner_model: str = 'urchade/gliner_mediumv2.1', glirel_model: str = 'jackboyla/glirel_beta', entity_confidence_threshold: float = 0.1, relationship_confidence_threshold: float = 0.1, device: str = 'cpu', ignore_self_loops: bool = True) None [source]¶
- 参数
allowed_nodes (列表[字符串]) –
allowed_relationships (联合[列表[字符串], 字典[字符串, 任何]]) –
gliner_model (字符串) –
glirel_model (字符串) –
entity_confidence_threshold (浮点数) –
relationship_confidence_threshold (浮点数) –
device (字符串) –
ignore_self_loops (布尔值) –
- 返回类型
无
- convert_to_graph_documents(documents: Sequence[Document]) List[GraphDocument] [source]¶
将一系列文档转换为图文档。
- 参数
documents (Sequence[Document]) – 原始文档。
kwargs – 额外关键字参数。
- 返回:
将变换后的文档作为图。
- 返回类型
Sequence[GraphDocument]
- process_document(document: Document) GraphDocument [source]¶
- 参数
document (Document) –
- 返回类型