langchain_community.document_loaders.parsers.audio.YandexSTTParser

class langchain_community.document_loaders.parsers.audio.YandexSTTParser(*, api_key: Optional[str] = None, iam_token: Optional[str] = None, model: str = 'general', language: str = 'auto')[源代码]

转录和解析音频文件。音频转录使用OpenAI的Whisper模型。

初始化解析器。

参数
  • api_key (可选[字符串]) – 服务账户的API密钥

  • role. (与ai.speechkit-stt.user一起使用) –

  • iam_token (可选[字符串]) – 服务账户的IAM令牌

  • role.

  • model (字符串) – 识别模型的名称。默认为通用。

  • language (字符串) – 使用ISO 639-1格式的语言。默认为自动语言识别。

必须提供 api_keyiam_token 之一,但不能同时提供。

方法

__init__([*, api_key, iam_token, model, ...])

初始化解析器。

lazy_parse(blob)

延迟解析blob。

parse(blob)

急切地将blob解析为文档或多个文档。

(初始化方法)__init__(*, api_key: Optional[str] = None, iam_token: Optional[str] = None, model: str = 'general', language: str = 'auto')[source]

初始化解析器。

参数
  • api_key (可选[字符串]) – 服务账户的API密钥

  • role. (与ai.speechkit-stt.user一起使用) –

  • iam_token (可选[字符串]) – 服务账户的IAM令牌

  • role.

  • model (字符串) – 识别模型的名称。默认为通用。

  • language (字符串) – 使用ISO 639-1格式的语言。默认为自动语言识别。

必须提供 api_keyiam_token 之一,但不能同时提供。

lazy_parse(blob: Blob) Iterator[Document][source]

延迟解析blob。

参数

(blob)Blob

返回类型

Iterator[Document]

parse(blob: Blob) List[Document]

急切地将blob解析为文档或多个文档。

这是一个用于交互式开发环境的便捷方法。

生产应用应优先考虑使用 lazy_parse 方法。

子类通常不应重写此 parse 方法。

参数

(blob)Blob - Blob 实例

返回

文档列表

返回类型

List[Document]