langchain_community.document_loaders.parsers.audio
.OpenAIWhisperParser¶
- class langchain_community.document_loaders.parsers.audio.OpenAIWhisperParser(api_key: Optional[str] = None, *, chunk_duration_threshold: float = 0.1, base_url: Optional[str] = None, language: Optional[str] = None, prompt: Optional[str] = None, response_format: Optional[Literal['json', 'text', 'srt', 'verbose_json', 'vtt']] = None, temperature: Optional[float] = None)[source]¶
转录并解析音频文件。
音频转录采用 OpenAI Whisper 模型。
- 参数
api_key (可选[str]) – OpenAI API 密钥
chunk_duration_threshold (float) – 块的最小持续时间为秒,注意:根据 OpenAI API,块持续时间应至少为 0.1 秒。如果块持续时间小于或等于阈值,则将其跳过。
base_url (可选[str]) –
language (可选[str]) –
prompt (可选[str]) –
response_format (可选[文字['json','text','srt','verbose_json','vtt']]) –
temperature (可选[浮点数]) –
方法
__init__
([api_key, ...])lazy_parse
(blob)懒式解析 blob。
parse
(blob)急式解析 blob 到文档或文档集。
- __init__(api_key: Optional[str] = None, *, chunk_duration_threshold: float = 0.1, base_url: Optional[str] = None, language: Optional[str] = None, prompt: Optional[str] = None, response_format: Optional[Literal['json', 'text', 'srt', 'verbose_json', 'vtt']] = None, temperature: Optional[float] = None)[源代码]¶
- 参数
api_key (可选]字符串[) -
chunk_duration_threshold (浮点数) -
base_url (可选[str]) –
language (可选[str]) –
prompt (可选[str]) –
response_format (可选[文字['json','text','srt','verbose_json','vtt']]) –
temperature (可选[浮点数]) –