langchain_experimental.data_anonymizer.presidio
.PresidioAnonymizerBase¶
- class langchain_experimental.data_anonymizer.presidio.PresidioAnonymizerBase(analyzed_fields: Optional[List[str]] = None, operators: Optional[Dict[str, OperatorConfig]] = None, languages_config: Optional[Dict] = None, add_default_faker_operators: bool = True, faker_seed: Optional[int] = None)[source]¶
基于Microsoft Presidio的基匿名化器。
了解更多:https://microsoft.github.io/presidio/
- 参数
analyzed_fields (Optional[List[str]]) – 要检测和匿名化的字段列表。默认为Microsoft Presidio支持的所有实体。
operators (Optional[Dict[str, OperatorConfig]]) – 用于匿名化的操作符。操作符允许对检测到的PII进行自定义匿名化。了解更多:https://microsoft.github.io/presidio/tutorial/10_simple_anonymization/
languages_config (Optional[Dict]) – NLP引擎的配置。列表中的第一语言将在未指定语言时用作self.anonymize(…)中的主语言。了解更多:https://microsoft.github.io/presidio/analyzer/customizing_nlp_models/
faker_seed (Optional[int]) – 初始化faker使用的种子。默认为None,这种情况下faker将被随机初始化并提供随机值。
add_default_faker_operators (bool) –
方法
__init__
([analyzed_fields, operators, ...])- param analyzed_fields
要检测和匿名化的字段列表。
add_operators
(operators)向匿名化器添加操作符
add_recognizer
(recognizer)向分析器添加识别器
anonymize
(text[, language, allow_list])匿名化文本。
- __init__(analyzed_fields: Optional[List[str]] = None, operators: Optional[Dict[str, OperatorConfig]] = None, languages_config: Optional[Dict] = None, add_default_faker_operators: bool = True, faker_seed: Optional[int] = None)[source]¶
- 参数
analyzed_fields (Optional[List[str]]) – 要检测和匿名化的字段列表。默认为Microsoft Presidio支持的所有实体。
operators (Optional[Dict[str, OperatorConfig]]) – 用于匿名化的操作符。操作符允许对检测到的PII进行自定义匿名化。了解更多:https://microsoft.github.io/presidio/tutorial/10_simple_anonymization/
languages_config (Optional[Dict]) – NLP引擎的配置。列表中的第一语言将在未指定语言时用作self.anonymize(…)中的主语言。了解更多:https://microsoft.github.io/presidio/analyzer/customizing_nlp_models/
faker_seed (Optional[int]) – 初始化faker使用的种子。默认为None,这种情况下faker将被随机初始化并提供随机值。
add_default_faker_operators (bool) –
- add_operators(operators: Dict[str, OperatorConfig]) None [source]¶
向匿名化器添加操作符
- 参数
operators (Dict[str, OperatorConfig]) – 要添加到匿名化器的操作员。
- 返回类型
None
- add_recognizer(recognizer: EntityRecognizer) None [source]¶
向分析器添加识别器
- 参数
识别器 (EntityRecognizer) – 需要添加到分析器的识别器。
- 返回类型
None
- anonymize(text: str, language: Optional[str] = None, allow_list: Optional[List[str]] = None) str¶
匿名化文本。
- 参数
text (str) –
language (可选[str]) –
allow_list (可选[列表[str]]) –
- 返回类型
str