langchain.evaluation.schema.PairwiseStringEvaluator

class langchain.evaluation.schema.PairwiseStringEvaluator[source]

比较两个模型(或同一模型的两个输出)的输出。

属性

requires_input

此评估器是否需要一个输入字符串。

requires_reference

此评估器是否需要一个参考标签。

方法

__init__()

aevaluate_string_pairs(*, prediction, ...[, ...])

异步评估输出字符串对。

evaluate_string_pairs(*, prediction, ...[, ...])

评估输出字符串对。

__init__()
async aevaluate_string_pairs(*, prediction: str, prediction_b: str, reference: Optional[str] = None, input: Optional[str] = None, **kwargs: Any) dict[source]

异步评估输出字符串对。

参数
  • prediction (str) – 第一个模型的输出字符串。

  • prediction_b (str) – 第二个模型的输出字符串。

  • reference (Optional[str], optional) – 预期输出 / 参考字符串。

  • input (Optional[str], optional) – 输入字符串。

  • kwargs (Any) – 额外的关键字参数,如回调和可选的参考字符串。

返回

包含偏好、分数和/或其他信息的字典。

返回类型

dict

evaluate_string_pairs(*, prediction: str, prediction_b: str, reference: Optional[str] = None, input: Optional[str] = None, **kwargs: Any) dict[源代码]

评估输出字符串对。

参数
  • prediction (str) – 第一个模型的输出字符串。

  • prediction_b (str) – 第二个模型的输出字符串。

  • reference (Optional[str], optional) – 预期输出 / 参考字符串。

  • input (Optional[str], optional) – 输入字符串。

  • kwargs (Any) – 额外的关键字参数,如回调和可选的参考字符串。

返回

包含偏好、分数和/或其他信息的字典。

返回类型

dict