langchain_community.document_transformers.html2text.Html2TextTransformer

class langchain_community.document_transformers.html2text.Html2TextTransformer(ignore_links: bool = True, ignore_images: bool = True)[源代码]

将特定搜索模式的出现替换为替换字符串

参数
  • ignore_links (布尔型) – 是否忽略链接;默认为True。

  • ignore_images (布尔型) – 是否忽略图片;默认为True。

示例

方法

__init__([ignore_links, ignore_images])

atransform_documents(documents, **kwargs)

异步转换文档列表。

transform_documents(documents, **kwargs)

转换文档列表。

__init__(ignore_links: bool = True, ignore_images: bool = True) None[源代码]
参数
  • ignore_links (布尔型) –

  • ignore_images (布尔型) –

返回类型

None

async atransform_documents(documents: Sequence[Document], **kwargs: Any) Sequence[Document][source]

异步转换文档列表。

参数
  • documents (Sequence[Document]) – 需要转换的文档序列。

  • kwargs (Any) –

返回

转换后的文档序列。

返回类型

Sequence[Document]

transform_documents(documents: Sequence[Document], **kwargs: Any) Sequence[Document][source]

转换文档列表。

参数
  • documents (Sequence[Document]) – 需要转换的文档序列。

  • kwargs (Any) –

返回

转换后的文档序列。

返回类型

Sequence[Document]

使用 Html2TextTransformer 的示例