langchain_experimental.agents.agent_toolkits.spark.base.create_spark_dataframe_agent

langchain_experimental.agents.agent_toolkits.spark.base.create_spark_dataframe_agent(llm: BaseLLM, df: Any, callback_manager: Optional[BaseCallbackManager] = None, prefix: str = '\nYou are working with a spark dataframe in Python. The name of the dataframe is `df`.\nYou should use the tools below to answer the question posed of you:', suffix: str = '\nThis is the result of `print(df.first())`:\n{df}\n\nBegin!\nQuestion: {input}\n{agent_scratchpad}', input_variables: Optional[List[str]] = None, verbose: bool = False, return_intermediate_steps: bool = False, max_iterations: Optional[int] = 15, max_execution_time: Optional[float] = None, early_stopping_method: str = 'force', agent_executor_kwargs: Optional[Dict[str, Any]] = None, allow_dangerous_code: bool = False, **kwargs: Any) AgentExecutor[source]

从LLM和dataframe构建Spark代理。

安全提示

此代理依赖于访问可以执行任意代码的python repl工具。这可能是危险的,需要在特殊的沙箱环境中安全使用。在不适当的沙箱环境中运行此代码可能导致任意代码执行漏洞,这可能引发数据泄露、数据丢失或其他安全事件。

请勿使用此代码处理不受信任的输入、高权限使用或在没有咨询安全团队关于适当沙箱化的情况下使用!

您必须通过设置allow_dangerous_code=True来同意使用此功能。

参数
  • allow_dangerous_code (bool) – bool, 默认 False 该代理依赖于可用于执行任意代码的 Python repl 工具。这可能会很危险,并需要特别隔离的环境才能安全使用。未能适当隔离此类会导致任意代码执行漏洞,这可能引起数据泄露、数据丢失或其他安全事件。您必须通过设置 allow_dangerous_code=True 来选择使用此功能。

  • llm (BaseLLM) –

  • df (Any) –

  • callback_manager (Optional[BaseCallbackManager]) –

  • prefix (str) –

  • suffix (str) –

  • input_variables (Optional[List[str]]) –

  • verbose (bool) –

  • return_intermediate_steps (bool) –

  • max_iterations (Optional[int]) –

  • max_execution_time (Optional[float]) –

  • early_stopping_method (str) –

  • agent_executor_kwargs (Optional[Dict[str, Any]]) –

  • kwargs (Any) –

返回类型

AgentExecutor

使用 create_spark_dataframe_agent 的示例