langchain_community.callbacks.upstash_ratelimit_callback.UpstashRatelimitHandler

class langchain_community.callbacks.upstash_ratelimit_callback.UpstashRatelimitHandler(identifier: str, *, token_ratelimit: None = None, request_ratelimit: None = None, include_output_tokens: bool = False)[源代码]

根据请求数量或输入中的令牌数量处理速率限制的回调。

它使用Upstash Ratelimit来跟踪速率限制,该速率限制利用Upstash Redis来跟踪状态。

在初始化链时,不应将其传递到链中。这是因为处理程序有一个状态,每次调用时应保持新鲜。相反,每次调用时都初始化并传递一个处理程序。

创建UpstashRatelimitHandler。必须传递一个标识符,类似于用户ID或IP地址。

此外,必须传递至少一个token_ratelimit或request_ratelimit参数。

参数
  • 联合int (identifier) - 标识符

  • str标识符

  • 可选Ratelimitrequest_ratelimit - 限制令牌数量的速率限制。仅与OpenAI模型协同工作,因为只有这些模型在其输出中提供令牌数量作为信息。

  • 可选Ratelimit- 限制请求数量的速率限制

  • bool (include_output_tokens) - 在根据令牌数量进行速率限制时是否计数输出令牌。仅在传递token_ratelimit时使用。默认值为False。

  • identifier (str) -

  • token_ratelimit (None) -

  • request_ratelimit (None) -

  • include_output_tokens (bool) -

示例

from upstash_redis import Redis
from upstash_ratelimit import Ratelimit, FixedWindow

redis = Redis.from_env()
ratelimit = Ratelimit(
    redis=redis,
    # fixed window to allow 10 requests every 10 seconds:
    limiter=FixedWindow(max_requests=10, window=10),
)

user_id = "foo"
handler = UpstashRatelimitHandler(
    identifier=user_id,
    request_ratelimit=ratelimit
)

# Initialize a simple runnable to test
chain = RunnableLambda(str)

# pass handler as callback:
output = chain.invoke(
    "input",
    config={
        "callbacks": [handler]
    }
)

属性

ignore_agent

是否忽略代理回调。

ignore_chain

是否忽略链回调。

ignore_chat_model

是否忽略聊天模型回调。

ignore_custom_event

忽略自定义事件。

ignore_llm

是否忽略LLM回调。

ignore_retriever

是否忽略检索器回调。

ignore_retry

是否忽略重试回调。

raise_error

是否在出现异常时引发错误。

run_inline

是否以内联方式运行回调。

方法

__init__(identifier, *[, token_ratelimit, ...])

创建UpstashRatelimitHandler。

on_agent_action(action, *, run_id[, ...])

在代理操作上运行。

on_agent_finish(finish, *, run_id[, ...])

在代理端运行。

on_chain_end(outputs, *, run_id[, parent_run_id])

当链结束时运行。

on_chain_error(error, *, run_id[, parent_run_id])

当链出错时运行。

on_chain_start(serialized, inputs, **kwargs)

当链开始运行时运行。

on_chat_model_start(serialized, messages, *, ...)

当聊天模型开始运行时运行。

on_custom_event(name, data, *, run_id[, ...])

覆盖以定义对自定义事件的处理程序。

on.llm_end(response, **kwargs)

当LLM运行结束时运行。

on_llm_error(error, *, run_id[, parent_run_id])

当LLM出错时运行。

on_llm_new_token(token, *[, chunk, ...])

当新LLM令牌出现时运行。

on_llm_start(serialized, prompts, **kwargs)

当LLM开始运行时运行。

on_retriever_end(documents, *, run_id[, ...])

当Retriever运行结束时运行。

on_retriever_error(error, *, run_id[, ...])

当Retriever出错时运行。

on_retriever_start(serialized, query, *, run_id)

当Retriever开始运行时运行。

on_retry(retry_state, *, run_id[, parent_run_id])

在重试事件上运行。

on_text(text, *, run_id[, parent_run_id])

在任意文本上运行。

on_tool_end(output, *, run_id[, parent_run_id])

在工具运行结束时运行。

on_tool_error(error, *, run_id[, parent_run_id])

在工具出错时运行。

on_tool_start(serialized, input_str, *, run_id)

在工具开始运行时运行。

reset([identifier])

如果提供了标识符,创建一个新的 UpstashRatelimitHandler 对象,但具有相同的速率限制配置。

__init__(identifier: str, *, token_ratelimit: None = None, request_ratelimit: None = None, include_output_tokens: bool = False)[source]

创建UpstashRatelimitHandler。必须传递一个标识符,类似于用户ID或IP地址。

此外,必须传递至少一个token_ratelimit或request_ratelimit参数。

参数
  • 联合int (identifier) - 标识符

  • str标识符

  • 可选Ratelimitrequest_ratelimit - 限制令牌数量的速率限制。仅与OpenAI模型协同工作,因为只有这些模型在其输出中提供令牌数量作为信息。

  • 可选Ratelimit- 限制请求数量的速率限制

  • bool (include_output_tokens) - 在根据令牌数量进行速率限制时是否计数输出令牌。仅在传递token_ratelimit时使用。默认值为False。

  • identifier (str) -

  • token_ratelimit (None) -

  • request_ratelimit (None) -

  • include_output_tokens (bool) -

示例

from upstash_redis import Redis
from upstash_ratelimit import Ratelimit, FixedWindow

redis = Redis.from_env()
ratelimit = Ratelimit(
    redis=redis,
    # fixed window to allow 10 requests every 10 seconds:
    limiter=FixedWindow(max_requests=10, window=10),
)

user_id = "foo"
handler = UpstashRatelimitHandler(
    identifier=user_id,
    request_ratelimit=ratelimit
)

# Initialize a simple runnable to test
chain = RunnableLambda(str)

# pass handler as callback:
output = chain.invoke(
    "input",
    config={
        "callbacks": [handler]
    }
)
on_agent_action(action: AgentAction, *, run_id: UUID, parent_run_id: Optional[UUID] = None, **kwargs: Any) Any

在代理操作上运行。

参数
  • action (AgentAction) – 代理动作。

  • run_id (UUID) – 运行 ID。这是当前运行的 ID。

  • parent_run_id (UUID) – 父运行 ID。这是父运行的 ID。

  • kwargs (Any) – 额外的关键字参数。

返回类型

Any

on_agent_finish(finish: AgentFinish, *, run_id: UUID, parent_run_id: Optional[UUID] = None, **kwargs: Any) Any

在代理端运行。

参数
  • finish (AgentFinish) – 代理完成。

  • run_id (UUID) – 运行 ID。这是当前运行的 ID。

  • parent_run_id (UUID) – 父运行 ID。这是父运行的 ID。

  • kwargs (Any) – 额外的关键字参数。

返回类型

Any

on_chain_end(outputs: Dict[str, Any], *, run_id: UUID, parent_run_id: Optional[UUID] = None, **kwargs: Any) Any

当链结束时运行。

参数
  • outputs (Dict[str, Any]) – 链的输出。

  • run_id (UUID) – 运行 ID。这是当前运行的 ID。

  • parent_run_id (UUID) – 父运行 ID。这是父运行的 ID。

  • kwargs (Any) – 额外的关键字参数。

返回类型

Any

on_chain_error(error: BaseException, *, run_id: UUID, parent_run_id: Optional[UUID] = None, **kwargs: Any) Any

当链出错时运行。

参数
  • error (BaseException) – 发生的错误。

  • run_id (UUID) – 运行 ID。这是当前运行的 ID。

  • parent_run_id (UUID) – 父运行 ID。这是父运行的 ID。

  • kwargs (Any) – 额外的关键字参数。

返回类型

Any

on_chain_start(serialized: Dict[str, Any], inputs: Dict[str, Any], **kwargs: Any) Any[source]

当链开始运行时运行。

on_chain_start 会在链执行过程中多次运行。为了确保它只被调用一次,我们保持一个布尔状态 _checked。如果没有 self._checked,我们将使用 request_ratelimit 调用限制,并在标识符被限制速率时抛出 UpstashRatelimitError

参数
  • 序列化 (Dict[str, Any]) –

  • 输入参数 (Dict[str, Any]) –

  • kwargs (Any) –

返回类型

Any

on_chat_model_start(serialized: Dict[str, Any], messages: List[List[BaseMessage]], *args, run_id: UUID, parent_run_id: Optional[UUID] = None, tags: Optional[List[str]] = None, metadata: Optional[Dict[str, Any]] = None, **kwargs) Any

当聊天模型开始运行时运行。

注意:此方法用于聊天模型。如果您正在实现

非聊天模型的处理程序,则应使用 on_llm_start。

参数
  • 序列化 (Dict[str, Any]) – 序列化的聊天模型。

  • 消息 (List[List[BaseMessage]]) – 消息。

  • run_id (UUID) – 运行 ID。这是当前运行的 ID。

  • parent_run_id (UUID) – 父运行 ID。这是父运行的 ID。

  • 标签 (Optional[List[str]]) – 标签。

  • 元数据 (Optional[Dict[str, Any]]) – 元数据。

  • kwargs (Any) – 额外的关键字参数。

返回类型

Any

on_custom_event(name: str, data: Any, *, run_id: UUID, tags: Optional[List[str]] = None, metadata: Optional[Dict[str, Any]] = None, **kwargs: Any) Any

覆盖以定义对自定义事件的处理程序。

参数
  • name (str) – 自定义事件的名称。

  • data (Any) – 自定义事件的数据。格式将与用户指定的格式相匹配。

  • run_id (UUID) – 运行的ID。

  • tags (Optional[List[str]]) – 与自定义事件关联的标签(包括继承的标签)。

  • metadata (Optional[Dict[str, Any]]) – 与自定义事件关联的元数据(包括继承的元数据)。

  • kwargs (Any) –

返回类型

Any

新增于版本0.2.15。

on_llm_end(response: LLMResult, **kwargs: Any) None[source]

当LLM运行结束时运行。

如果将 include_output_tokens 设置为True,将计算LLM完成中的token数进行速率限制。

参数
返回类型

None

on_llm_error(error: BaseException, *, run_id: UUID, parent_run_id: Optional[UUID] = None, **kwargs: Any) Any

当LLM出错时运行。

参数
  • error (BaseException) – 发生的错误。

  • run_id (UUID) – 运行 ID。这是当前运行的 ID。

  • parent_run_id (UUID) – 父运行 ID。这是父运行的 ID。

  • kwargs (Any) – 额外的关键字参数。

返回类型

Any

on_llm_new_token(token: str, *, chunk: Optional[Union[GenerationChunk, ChatGenerationChunk]] = None, run_id: UUID, parent_run_id: Optional[UUID] = None, **kwargs: Any) Any

在新的LLM令牌上运行。仅当启用流式传输时可用。

参数
  • token (str) – 新令牌。

  • chunk (GenerationChunk | ChatGenerationChunk) – 新生成的内容块,包含内容和其他信息。

  • run_id (UUID) – 运行 ID。这是当前运行的 ID。

  • parent_run_id (UUID) – 父运行 ID。这是父运行的 ID。

  • kwargs (Any) – 额外的关键字参数。

返回类型

Any

on_llm_start(serialized: Dict[str, Any], prompts: List[str], **kwargs: Any) None[source]

当LLM开始运行时运行。

参数
  • 序列化 (Dict[str, Any]) –

  • prompts (列表[字符串]) –

  • kwargs (Any) –

返回类型

None

on_retriever_end(documents: Sequence[Document], *, run_id: UUID, parent_run_id: Optional[UUID] = None, **kwargs: Any) Any

当Retriever运行结束时运行。

参数
  • documents (序列[Document]) – 检索到的文档。

  • run_id (UUID) – 运行 ID。这是当前运行的 ID。

  • parent_run_id (UUID) – 父运行 ID。这是父运行的 ID。

  • kwargs (Any) – 额外的关键字参数。

返回类型

Any

on_retriever_error(error: BaseException, *, run_id: UUID, parent_run_id: Optional[UUID] = None, **kwargs: Any) Any

当Retriever出错时运行。

参数
  • error (BaseException) – 发生的错误。

  • run_id (UUID) – 运行 ID。这是当前运行的 ID。

  • parent_run_id (UUID) – 父运行 ID。这是父运行的 ID。

  • kwargs (Any) – 额外的关键字参数。

返回类型

Any

on_retriever_start(serialized: Dict[str, Any], query: str, *, run_id: UUID, parent_run_id: Optional[UUID] = None, tags: Optional[List[str]] = None, metadata: Optional[Dict[str, Any]] = None, **kwargs: Any) Any

当Retriever开始运行时运行。

参数
  • serialized (Dict[str, Any]) – 序列化的检索器。

  • query (str) – 查询。

  • run_id (UUID) – 运行 ID。这是当前运行的 ID。

  • parent_run_id (UUID) – 父运行 ID。这是父运行的 ID。

  • 标签 (Optional[List[str]]) – 标签。

  • 元数据 (Optional[Dict[str, Any]]) – 元数据。

  • kwargs (Any) – 额外的关键字参数。

返回类型

Any

on_retry(retry_state: RetryCallState, *, run_id: UUID, parent_run_id: Optional[UUID] = None, **kwargs: Any) Any

在重试事件上运行。

参数
  • retry_state (RetryCallState) – 重试状态。

  • run_id (UUID) – 运行 ID。这是当前运行的 ID。

  • parent_run_id (UUID) – 父运行 ID。这是父运行的 ID。

  • kwargs (Any) – 额外的关键字参数。

返回类型

Any

on_text(text: str, *, run_id: UUID, parent_run_id: Optional[UUID] = None, **kwargs: Any) Any

在任意文本上运行。

参数
  • text (str) – 文本内容。

  • run_id (UUID) – 运行 ID。这是当前运行的 ID。

  • parent_run_id (UUID) – 父运行 ID。这是父运行的 ID。

  • kwargs (Any) – 额外的关键字参数。

返回类型

Any

on_tool_end(output: Any, *, run_id: UUID, parent_run_id: Optional[UUID] = None, **kwargs: Any) Any

在工具运行结束时运行。

参数
  • output (Any) – 工具的输出结果。

  • run_id (UUID) – 运行 ID。这是当前运行的 ID。

  • parent_run_id (UUID) – 父运行 ID。这是父运行的 ID。

  • kwargs (Any) – 额外的关键字参数。

返回类型

Any

on_tool_error(error: BaseException, *, run_id: UUID, parent_run_id: Optional[UUID] = None, **kwargs: Any) Any

在工具出错时运行。

参数
  • error (BaseException) – 发生的错误。

  • run_id (UUID) – 运行 ID。这是当前运行的 ID。

  • parent_run_id (UUID) – 父运行 ID。这是父运行的 ID。

  • kwargs (Any) – 额外的关键字参数。

返回类型

Any

on_tool_start(serialized: Dict[str, Any], input_str: str, *, run_id: UUID, parent_run_id: Optional[UUID] = None, tags: Optional[List[str]] = None, metadata: Optional[Dict[str, Any]] = None, inputs: Optional[Dict[str, Any]] = None, **kwargs: Any) Any

在工具开始运行时运行。

参数
  • serialized (Dict[str, Any]) – 序列化的工具。

  • input_str (str) – 输入字符串。

  • run_id (UUID) – 运行 ID。这是当前运行的 ID。

  • parent_run_id (UUID) – 父运行 ID。这是父运行的 ID。

  • 标签 (Optional[List[str]]) – 标签。

  • 元数据 (Optional[Dict[str, Any]]) – 元数据。

  • inputs (Optional[Dict[str, Any]]) – 输入。

  • kwargs (Any) – 额外的关键字参数。

返回类型

Any

reset(identifier: Optional[str] = None) UpstashRatelimitHandler[source]

创建一个新的 UpstashRatelimitHandler 对象,具有相同的速率限制配置,如果提供了标识符,则具有新的标识符。

同时重置处理器的状态。

参数

identifier (Optional[str]) –

返回类型

UpstashRatelimitHandler