langchain_community.document_loaders.parsers.audio.OpenAIWhisperParser

class langchain_community.document_loaders.parsers.audio.OpenAIWhisperParser(api_key: Optional[str] = None, *, chunk_duration_threshold: float = 0.1, base_url: Optional[str] = None, language: Optional[str] = None, prompt: Optional[str] = None, response_format: Optional[Literal['json', 'text', 'srt', 'verbose_json', 'vtt']] = None, temperature: Optional[float] = None)[source]

转录并解析音频文件。

音频转录采用 OpenAI Whisper 模型。

参数
  • api_key (可选[str]) – OpenAI API 密钥

  • chunk_duration_threshold (float) – 块的最小持续时间为秒,注意:根据 OpenAI API,块持续时间应至少为 0.1 秒。如果块持续时间小于或等于阈值,则将其跳过。

  • base_url (可选[str]) –

  • language (可选[str]) –

  • prompt (可选[str]) –

  • response_format (可选[文字['json','text','srt','verbose_json','vtt']]) –

  • temperature (可选[浮点数]) –

方法

__init__([api_key, ...])

lazy_parse(blob)

懒式解析 blob。

parse(blob)

急式解析 blob 到文档或文档集。

__init__(api_key: Optional[str] = None, *, chunk_duration_threshold: float = 0.1, base_url: Optional[str] = None, language: Optional[str] = None, prompt: Optional[str] = None, response_format: Optional[Literal['json', 'text', 'srt', 'verbose_json', 'vtt']] = None, temperature: Optional[float] = None)[源代码]
参数
  • api_key可选]字符串[) -

  • chunk_duration_threshold浮点数) -

  • base_url (可选[str]) –

  • language (可选[str]) –

  • prompt (可选[str]) –

  • response_format (可选[文字['json','text','srt','verbose_json','vtt']]) –

  • temperature (可选[浮点数]) –

lazy_parse(blob: Blob) Iterator[Document][source]

懒式解析 blob。

参数

blobBlob) -

返回类型

Iterator[Document]

parse(blob: Blob) List[Document]

急式解析 blob 到文档或文档集。

这是一个用于交互式开发环境的便捷方法。

生产应用程序应优先使用 lazy_parse 方法。

子类通常不应覆盖此解析方法。

参数

blobBlob) - Blob 实例

返回

文档列表

返回类型

List[Document]

OpenAIWhisperParser 使用示例