• LangChain
  • 核心
  • 社区
  • 实验性
  • 文本分割器
  • ai21
  • airbyte
  • anthropic
  • astradb
  • aws
  • azure-dynamic-sessions
  • chroma
  • cohere
  • couchbase
  • elasticsearch
  • exa
  • fireworks
  • google-community
  • google-genai
  • google-vertexai
  • groq
  • huggingface
  • ibm
  • milvus
  • mistralai
  • mongodb
  • nomic
  • nvidia-ai-endpoints
  • ollama
  • openai
  • pinecone
  • postgres
  • prompty
  • qdrant
  • robocorp
  • together
  • unstructured
  • voyageai
  • weaviate
  • 合作伙伴库
  • 文档
  • langchain_core.utils.html.find_all_links
    • find_all_links()

langchain_core.utils.html.find_all_links¶

langchain_core.utils.html.find_all_links(raw_html: str, *, pattern: Optional[Union[str, Pattern]] = None) → List[str][source]¶

从原始HTML字符串中提取所有链接。

参数
  • raw_html (str) – 原始HTML。

  • pattern (Optional[Union[str, Pattern]]) – 从原始HTML中提取链接时使用的正则表达式。

返回

所有链接

返回类型

List[str]

© 2023, LangChain, Inc. . 最后更新于 2024 年 8 月 6 日。