langchain社区.document加载器.youtube
.GoogleApiYouTubeLoader¶
- class langchain_community.document_loaders.youtube.GoogleApiYoutubeLoader(google_api_client: GoogleApiClient, channel_name: Optional[str] = None, video_ids: Optional[List[str]] = None, add_video_info: bool = True, captions_language: str = 'en', continue_on_failure: bool = False)[源代码]¶
从YouTube频道加载所有视频。
使用前,您需要安装python包
googleapiclient,youtube_transcript_api
。由于服务需要google_api_client,您首先需要初始化GoogleApiClient。此外,您还需要提供频道名称或视频ID列表(https://developers.google.com/docs/api/quickstart/python)。
示例
from langchain_community.document_loaders import GoogleApiClient from langchain_community.document_loaders import GoogleApiYoutubeLoader google_api_client = GoogleApiClient( service_account_path=Path("path_to_your_sec_file.json") ) loader = GoogleApiYoutubeLoader( google_api_client=google_api_client, channel_name = "CodeAesthetic" ) load.load()
属性
add_video_info
captions_language
channel_name
continue_on_failure
video_ids
google_api_client
方法
__init__
(google_api_client[, channel_name, ...])文档的懒加载器。
aload
()将数据加载到文档对象中。
文档的懒加载器。
load
()加载文档。
load_and_split
([text_splitter])加载文档并分割成块。
验证是否已设置folder_id或document_ids,但不能同时设置。
- 参数
google_api_client (GoogleApiClient) –
channel_name (Optional[str]) –
video_ids (可选[列表[字符串]]) –
add_video_info (布尔型) –
captions_language (字符串) –
continue_on_failure (布尔型) –
- __init__(google_api_client: GoogleApiClient, channel_name: Optional[str] = None, video_ids: Optional[List[str]] = None, add_video_info: bool = True, captions_language: str = 'en', continue_on_failure: bool = False) None ¶
- 参数
google_api_client (GoogleApiClient) –
channel_name (Optional[str]) –
video_ids (可选[列表[字符串]]) –
add_video_info (布尔型) –
captions_language (字符串) –
continue_on_failure (布尔型) –
- 返回类型
None
- load_and_split(text_splitter: Optional[TextSplitter] = None) List[Document]¶
加载数据并将其拆分为片段。片段以文档的形式返回。
不要覆盖此方法。应考虑将其弃用!
- 参数
text_splitter (Optional[TextSplitter]) – 用于拆分文档的TextSplitter实例。默认值为RecursiveCharacterTextSplitter。
- 返回值
文档列表。
- 返回类型
列表[Document]
- classmethod validate_channel_or_videoIds_is_set(values: Dict[str, Any]) Dict[str, Any] [source]¶
验证是否已设置folder_id或document_ids,但不能同时设置。
- 参数
values (Dict[str, Any]) –
- 返回类型
Dict[str, Any]