langchain_experimental.data_anonymizer.deanonymizer_matching_strategies
.fuzzy_matching_strategy¶
- langchain_experimental.data_anonymizer.deanonymizer_matching_strategies.fuzzy_matching_strategy(text: str, deanonymizer_mapping: Dict[str, Dict[str, str]], max_l_dist: int = 3) str [source]¶
脱敏信息还原的模糊匹配策略。
它使用模糊匹配来找出文本中匿名实体的位置。将所有匿名实体替换为原始实体。
- 参数
text (str) – 需要还原的文本
deanonymizer_mapping (Dict[str, Dict[str, str]]) – 匿名实体与原始实体的映射关系
max_l_dist (int) – 匿名实体与待匹配文本片段的最大Levenshtein距离,超过此距离认为匹配成功
- 返回类型
str
- 匹配示例
Kaenu Reves -> Keanu Reeves John F. Kennedy -> John Kennedy