`langchain_community.document_loaders.browserless`.BrowserlessLoader¶

class langchain_community.document_loaders.browserless.BrowserlessLoader(api_token: str, urls: Union[str, List[str]], text_content: bool = True)[源代码]¶

使用Browserless /content 端点加载网页。

使用API密钥和要抓取的URL进行初始化

属性

`api_token`	Browserless API密钥。
`urls`	要抓取的URL列表。

方法

`__init__`(api_token, urls[, text_content])	使用API密钥和要抓取的URL进行初始化
`alazy_load`()	Documents的懒加载器。
`aload`()	将数据加载到Document对象中。
`lazy_load`()	从URL中懒加载Documents。
`load`()	将数据加载到Document对象中。
`load_and_split`([text_splitter])	加载Documents并将其拆分为块。

参数

api_token (str) –
urls (Union[str, List[str]]) –
text_content (bool) –

__init__(api_token: str, urls: Union[str, List[str]], text_content: bool = True)[源代码]¶

使用API密钥和要抓取的URL进行初始化

参数

api_token (str) –
urls (Union[str, List[str]]) –
text_content (bool) –

async alazy_load() → AsyncIterator[Document]¶

Documents的懒加载器。

返回类型: AsyncIterator[Document]

async aload() → List[Document]¶

将数据加载到Document对象中。

返回类型: List[Document]

lazy_load() → Iterator[Document][source]¶

从URL中懒加载Documents。

返回类型: Iterator[Document]

load() → List[Document]¶

将数据加载到Document对象中。

返回类型: List[Document]

load_and_split(text_splitter: Optional[TextSplitter] = None) → List[Document]¶

加载文档，并将其拆分为块。块作为文档返回。

不要覆盖此方法。应将其视为已弃用！

参数: text_splitter (可选[TextSplitter]) – 用于拆分文档的 TextSplitter 实例。默认为 RecursiveCharacterTextSplitter。
返回: 文档列表。
返回类型: List[Document]

使用 BrowserlessLoader 的示例¶

Browserless

langchain_community.document_loaders.browserless.BrowserlessLoader¶

使用 BrowserlessLoader 的示例¶

`langchain_community.document_loaders.browserless`.BrowserlessLoader¶