langchain_community.document_transformers.html2text
.Html2TextTransformer¶
- class langchain_community.document_transformers.html2text.Html2TextTransformer(ignore_links: bool = True, ignore_images: bool = True)[源代码]¶
将特定搜索模式的出现替换为替换字符串
- 参数
ignore_links (布尔型) – 是否忽略链接;默认为True。
ignore_images (布尔型) – 是否忽略图片;默认为True。
示例
方法
__init__
([ignore_links, ignore_images])atransform_documents
(documents, **kwargs)异步转换文档列表。
transform_documents
(documents, **kwargs)转换文档列表。
- __init__(ignore_links: bool = True, ignore_images: bool = True) None [源代码]¶
- 参数
ignore_links (布尔型) –
ignore_images (布尔型) –
- 返回类型
None