`langchain.evaluation.schema`.PairwiseStringEvaluator¶

class langchain.evaluation.schema.PairwiseStringEvaluator[source]¶

比较两个模型（或同一模型的两个输出）的输出。

属性

`requires_input`	此评估器是否需要一个输入字符串。
`requires_reference`	此评估器是否需要一个参考标签。

方法

`__init__`()
`aevaluate_string_pairs`(*， prediction， ...[， ...])	异步评估输出字符串对。
`evaluate_string_pairs`(*， prediction， ...[， ...])	评估输出字符串对。

__init__()¶

async aevaluate_string_pairs(*, prediction: str, prediction_b: str, reference: Optional[str] = None, input: Optional[str] = None, **kwargs: Any) → dict[source]¶

异步评估输出字符串对。

参数

prediction (str) – 第一个模型的输出字符串。
prediction_b (str) – 第二个模型的输出字符串。
reference (Optional[str], optional) – 预期输出 / 参考字符串。
input (Optional[str], optional) – 输入字符串。
kwargs (Any) – 额外的关键字参数，如回调和可选的参考字符串。

返回

包含偏好、分数和/或其他信息的字典。

返回类型

dict

evaluate_string_pairs(*, prediction: str, prediction_b: str, reference: Optional[str] = None, input: Optional[str] = None, **kwargs: Any) → dict[源代码]¶

评估输出字符串对。