langchain_experimental.data_anonymizer.deanonymizer_matching_strategies
.ngram_fuzzy_matching_strategy¶
- langchain_experimental.data_anonymizer.deanonymizer_matching_strategies.ngram_fuzzy_matching_strategy(text: str, deanonymizer_mapping: Dict[str, Dict[str, str]], fuzzy_threshold: int = 85, use_variable_length: bool = True) str [source]¶
N-gram 模糊匹配去匿名策略。
它将所有匿名实体替换为原始实体。它使用模糊匹配来寻找匿名实体在文本中的位置。从文本中生成长度与匿名实体相同的n-gram,并使用模糊匹配来查找匿名实体在文本中的位置。
- 参数
text (str) – 要去匿名化的文本
deanonymizer_mapping (Dict[str, Dict[str, str]]) – 匿名实体与原始实体之间的映射
fuzzy_threshold (int) – 模糊匹配阈值
use_variable_length (bool) – 是否使用(various lengths of n-gram)或仅n-gram
- 返回类型
str