langchain.evaluation.schema
.PairwiseStringEvaluator¶
- class langchain.evaluation.schema.PairwiseStringEvaluator[source]¶
比较两个模型(或同一模型的两个输出)的输出。
属性
requires_input
此评估器是否需要一个输入字符串。
requires_reference
此评估器是否需要一个参考标签。
方法
__init__
()aevaluate_string_pairs
(*, prediction, ...[, ...])异步评估输出字符串对。
evaluate_string_pairs
(*, prediction, ...[, ...])评估输出字符串对。
- __init__()¶
- async aevaluate_string_pairs(*, prediction: str, prediction_b: str, reference: Optional[str] = None, input: Optional[str] = None, **kwargs: Any) dict [source]¶
异步评估输出字符串对。
- 参数
prediction (str) – 第一个模型的输出字符串。
prediction_b (str) – 第二个模型的输出字符串。
reference (Optional[str], optional) – 预期输出 / 参考字符串。
input (Optional[str], optional) – 输入字符串。
kwargs (Any) – 额外的关键字参数,如回调和可选的参考字符串。
- 返回
包含偏好、分数和/或其他信息的字典。
- 返回类型
dict
- evaluate_string_pairs(*, prediction: str, prediction_b: str, reference: Optional[str] = None, input: Optional[str] = None, **kwargs: Any) dict [源代码]¶
评估输出字符串对。
- 参数
prediction (str) – 第一个模型的输出字符串。
prediction_b (str) – 第二个模型的输出字符串。
reference (Optional[str], optional) – 预期输出 / 参考字符串。
input (Optional[str], optional) – 输入字符串。
kwargs (Any) – 额外的关键字参数,如回调和可选的参考字符串。
- 返回
包含偏好、分数和/或其他信息的字典。
- 返回类型
dict