langchain_community.document_loaders.bilibili
.BiliBiliLoader¶
- class langchain_community.document_loaders.bilibili.BiliBiliLoader(video_urls: List[str], sessdata: str = '', bili_jct: str = '', buvid3: str = '')[source]¶
从B站视频中加载获取旁白。
使用B站视频URL和认证cookie初始化加载器。如果没有提供认证cookie,则加载器无法获取旁白,只能获取视频信息。
- 参数:
video_urls (列表[[str]]) – B站视频URL列表。
sessdata (字符串) – 用于认证的SESSDATA cookie值。
bili_jct (字符串) – 用于认证的BILI_JCT cookie值。
buvid3 (字符串) – 用于认证的BUVI3 cookie值。
方法:
__init__
(video_urls[, sessdata, bili_jct, ...])使用B站视频URL和认证cookie初始化加载器。
文档的懒惰加载器。
aload
()将数据加载到文档对象中。
文档的懒惰加载器。
load
()加载并返回包含视频旁白的文档列表。
load_and_split
([text_splitter])加载文档,并分割为块。
- __init__(video_urls: List[str], sessdata: str = '', bili_jct: str = '', buvid3: str = '')[source]¶
使用B站视频URL和认证cookie初始化加载器。如果没有提供认证cookie,则加载器无法获取旁白,只能获取视频信息。
- 参数:
video_urls (列表[[str]]) – B站视频URL列表。
sessdata (字符串) – 用于认证的SESSDATA cookie值。
bili_jct (字符串) – 用于认证的BILI_JCT cookie值。
buvid3 (字符串) – 用于认证的BUVI3 cookie值。
- load_and_split(text_splitter: Optional[TextSplitter] = None) List[Document] ¶
加载数据并分割为块。块以文档的形式返回。
不要重写此方法。应考虑将其弃用!
- 参数:
text_splitter (可选[TextSplitter]) – 用于分割文档的 TextSplitter 实例。默认为 RecursiveCharacterTextSplitter。
- 返回值
文档列表。
- 返回类型
列表[Document]