langchain_core.utils.html
.find_all_links¶
- langchain_core.utils.html.find_all_links(raw_html: str, *, pattern: Optional[Union[str, Pattern]] = None) List[str] [source]¶
从原始HTML字符串中提取所有链接。
- 参数
raw_html (str) – 原始HTML。
pattern (Optional[Union[str, Pattern]]) – 从原始HTML中提取链接时使用的正则表达式。
- 返回
所有链接
- 返回类型
List[str]