langchain社区.document加载器.youtube.GoogleApiYouTubeLoader

class langchain_community.document_loaders.youtube.GoogleApiYoutubeLoader(google_api_client: GoogleApiClient, channel_name: Optional[str] = None, video_ids: Optional[List[str]] = None, add_video_info: bool = True, captions_language: str = 'en', continue_on_failure: bool = False)[源代码]

从YouTube频道加载所有视频。

使用前,您需要安装python包googleapiclient,youtube_transcript_api。由于服务需要google_api_client,您首先需要初始化GoogleApiClient。

此外,您还需要提供频道名称或视频ID列表(https://developers.google.com/docs/api/quickstart/python)。

示例

from langchain_community.document_loaders import GoogleApiClient
from langchain_community.document_loaders import GoogleApiYoutubeLoader
google_api_client = GoogleApiClient(
    service_account_path=Path("path_to_your_sec_file.json")
)
loader = GoogleApiYoutubeLoader(
    google_api_client=google_api_client,
    channel_name = "CodeAesthetic"
)
load.load()

属性

add_video_info

captions_language

channel_name

continue_on_failure

video_ids

google_api_client

方法

__init__(google_api_client[, channel_name, ...])

alazy_load()

文档的懒加载器。

aload()

将数据加载到文档对象中。

lazy_load()

文档的懒加载器。

load()

加载文档。

load_and_split([text_splitter])

加载文档并分割成块。

validate_channel_or_videoIds_is_set(values)

验证是否已设置folder_id或document_ids,但不能同时设置。

参数
  • google_api_client (GoogleApiClient) –

  • channel_name (Optional[str]) –

  • video_ids (可选[列表[字符串]]) –

  • add_video_info (布尔型) –

  • captions_language (字符串) –

  • continue_on_failure (布尔型) –

__init__(google_api_client: GoogleApiClient, channel_name: Optional[str] = None, video_ids: Optional[List[str]] = None, add_video_info: bool = True, captions_language: str = 'en', continue_on_failure: bool = False) None
参数
  • google_api_client (GoogleApiClient) –

  • channel_name (Optional[str]) –

  • video_ids (可选[列表[字符串]]) –

  • add_video_info (布尔型) –

  • captions_language (字符串) –

  • continue_on_failure (布尔型) –

返回类型

None

async alazy_load() AsyncIterator[Document]

文档的懒加载器。

返回类型

AsyncIterator[Document]

async aload() List[Document]

将数据加载到文档对象中。

返回类型

List[Document]

lazy_load() Iterator[Document]

文档的懒加载器。

返回类型

Iterator[Document]

load() List[Document][source]

加载文档。

返回类型

List[Document]

load_and_split(text_splitter: Optional[TextSplitter] = None) List[Document]

加载数据并将其拆分为片段。片段以文档的形式返回。

不要覆盖此方法。应考虑将其弃用!

参数

text_splitter (Optional[TextSplitter]) – 用于拆分文档的TextSplitter实例。默认值为RecursiveCharacterTextSplitter。

返回值

文档列表。

返回类型

列表[Document]

classmethod validate_channel_or_videoIds_is_set(values: Dict[str, Any]) Dict[str, Any][source]

验证是否已设置folder_id或document_ids,但不能同时设置。

参数

values (Dict[str, Any]) –

返回类型

Dict[str, Any]

使用GoogleApiYoutubeLoader的示例