langchain_experimental.tabular_synthetic_data.openai.create_openai_data_generator

langchain_experimental.tabular_synthetic_data.openai.create_openai_data_generator(output_schema: Union[Dict[str, Any], Type[BaseModel]], llm: ChatOpenAI, prompt: BasePromptTemplate, output_parser: Optional[BaseLLMOutputParser] = None, **kwargs: Any) SyntheticDataGenerator[source]

创建为 OpenAI 模型量身定制的 SyntheticDataGenerator 实例。

此函数创建一个 LLM 链,该链基于提供的模式、语言模型和提示模板,专为结构化输出而设计。生成的链随后用于实例化并返回 SyntheticDataGenerator。

参数
  • output_schema (Union[Dict[str, Any], Type[BaseModel]]) – 预期输出的模式

  • a (输出。可以是表示有效 JsonSchema 的字典,或者) –

  • class. (Pydantic BaseModel) –

  • llm (ChatOpenAI) – 要使用的 OpenAI 语言模型。

  • prompt (BasePromptTemplate) – 用于生成提示的模板。

  • output_parser (Optional[BaseLLMOutputParser], optional) – 用于处理模型输出的解析器。

  • provided (处理模型输出。如果没有提供) –

  • inferred (将使用默认解析器) –

  • types. (从函数类型推断) –

  • kwargs (Any) – 要传递给的其他关键字参数

  • create_structured_output_chain。

返回类型

SyntheticDataGenerator

返回: SyntheticDataGenerator: 使用构建的链设置的数据生成器实例。

用法

要生成具有结构化输出的合成数据,首先定义您期望的输出模式。然后,使用此函数创建一个 SyntheticDataGenerator 实例。获得生成器后,您可以利用其方法生成所需的合成数据。

create_openai_data_generator 的使用示例