langchain_community.document_compressors.jina_rerank.JinaRerank

class langchain_community.document_compressors.jina_rerank.JinaRerank[source]

基类: BaseDocumentCompressor

使用 Jina Rerank API 的文档压缩器。

通过解析和验证关键字参数中的输入数据来创建新模型。

如果输入数据无法解析为有效的模型,将引发 ValidationError。

参数jina_api_key : Optional[str] = None

Jina API密钥。必须直接指定或通过环境变量JINA_API_KEY。

参数model : str = 'jina-reranker-v1-base-en'

用于重新排序的模型。

参数session : Any = None

用于与API通信的请求会话。

参数top_n : Optional[int] = 3

要返回的文档数量。

参数user_agent : str = 'langchain'

发起请求的应用程序的标识符。

async acompress_documents(documents: Sequence[Document], query: str, callbacks: Optional[Union[List[BaseCallbackHandler], BaseCallbackManager]] = None) Sequence[Document]

根据查询上下文异步压缩检索到的文档。

参数
返回

压缩后的文档。

返回类型

Sequence[Document]

compress_documents(documents: Sequence[Document], query: str, callbacks: Optional[Union[List[BaseCallbackHandler], BaseCallbackManager]] = None) Sequence[Document][source]

使用Jina的重新排序API压缩文档。

参数
返回

压缩后的文档序列。

返回类型

Sequence[Document]

rerank(documents: Sequence[Union[str, Document, dict]], query: str, *, model: Optional[str] = None, top_n: Optional[int] = -1, max_chunks_per_doc: Optional[int] = None) List[Dict[str, Any]][源代码]

根据查询相关度对提供的文档进行排序。

参数
  • 查询 (str) – 用于重新排序的查询。

  • 文档 (Sequence[Union[str, Document, dict]]) – 要重新排序的文档序列。

  • 模型 (Optional[str]) – 用于重新排序的模型。默认为 self.model。

  • top_n (Optional[int]) – 返回的结果数量。如果为 None,则返回所有结果。默认为 self.top_n。

  • max_chunks_per_doc (Optional[int]) – 从文档中衍生出的最大块数。

返回类型

列表[字典[str, 任何类型]]

使用 JinaRerank 的示例