langchain_community.document_loaders.bilibili.BiliBiliLoader

class langchain_community.document_loaders.bilibili.BiliBiliLoader(video_urls: List[str], sessdata: str = '', bili_jct: str = '', buvid3: str = '')[source]

从B站视频中加载获取旁白。

使用B站视频URL和认证cookie初始化加载器。如果没有提供认证cookie,则加载器无法获取旁白,只能获取视频信息。

参数:
  • video_urls (列表[[str]]) – B站视频URL列表。

  • sessdata (字符串) – 用于认证的SESSDATA cookie值。

  • bili_jct (字符串) – 用于认证的BILI_JCT cookie值。

  • buvid3 (字符串) – 用于认证的BUVI3 cookie值。

方法:

__init__(video_urls[, sessdata, bili_jct, ...])

使用B站视频URL和认证cookie初始化加载器。

alazy_load()

文档的懒惰加载器。

aload()

将数据加载到文档对象中。

lazy_load()

文档的懒惰加载器。

load()

加载并返回包含视频旁白的文档列表。

load_and_split([text_splitter])

加载文档,并分割为块。

__init__(video_urls: List[str], sessdata: str = '', bili_jct: str = '', buvid3: str = '')[source]

使用B站视频URL和认证cookie初始化加载器。如果没有提供认证cookie,则加载器无法获取旁白,只能获取视频信息。

参数:
  • video_urls (列表[[str]]) – B站视频URL列表。

  • sessdata (字符串) – 用于认证的SESSDATA cookie值。

  • bili_jct (字符串) – 用于认证的BILI_JCT cookie值。

  • buvid3 (字符串) – 用于认证的BUVI3 cookie值。

async alazy_load() AsyncIterator[Document]

文档的懒惰加载器。

返回类型

AsyncIterator[Document]

async aload() List[Document]

将数据加载到文档对象中。

返回类型

列表[Document]

lazy_load() Iterator[Document]

文档的懒惰加载器。

返回类型

迭代器[Document]

load() List[Document][source]

加载并返回包含视频旁白的文档列表。

返回值

文档对象的转写和元数据列表。

返回类型

列表[Document]

load_and_split(text_splitter: Optional[TextSplitter] = None) List[Document]

加载数据并分割为块。块以文档的形式返回。

不要重写此方法。应考虑将其弃用!

参数:

text_splitter (可选[TextSplitter]) – 用于分割文档的 TextSplitter 实例。默认为 RecursiveCharacterTextSplitter。

返回值

文档列表。

返回类型

列表[Document]

BiliBiliLoader 的示例用法