`langchain_community.document_compressors.jina_rerank`.JinaRerank¶

class langchain_community.document_compressors.jina_rerank.JinaRerank[source]¶

基类: BaseDocumentCompressor

使用 Jina Rerank API 的文档压缩器。

通过解析和验证关键字参数中的输入数据来创建新模型。

如果输入数据无法解析为有效的模型，将引发 ValidationError。

参数jina_api_key : Optional[str] = None¶: Jina API密钥。必须直接指定或通过环境变量JINA_API_KEY。

参数model : str = 'jina-reranker-v1-base-en'¶: 用于重新排序的模型。

参数session : Any = None¶: 用于与API通信的请求会话。

参数top_n : Optional[int] = 3¶: 要返回的文档数量。

参数user_agent : str = 'langchain'¶: 发起请求的应用程序的标识符。

async acompress_documents(documents: Sequence[Document], query: str, callbacks: Optional[Union[List[BaseCallbackHandler], BaseCallbackManager]] = None) → Sequence[Document]¶

根据查询上下文异步压缩检索到的文档。

参数

documents (Sequence[Document]) – 检索到的文档。
query (str) – 查询上下文。
callbacks (Optional[Union[List[BaseCallbackHandler], BaseCallbackManager]]) – 压缩过程中的可选回调。

返回

压缩后的文档。

返回类型

Sequence[Document]

compress_documents(documents: Sequence[Document], query: str, callbacks: Optional[Union[List[BaseCallbackHandler], BaseCallbackManager]] = None) → Sequence[Document][source]¶

使用Jina的重新排序API压缩文档。

参数

documents (Sequence[Document]) – 要压缩的文档序列。
query (str) – 用于压缩文档的查询。
callbacks (Optional[Union[List[BaseCallbackHandler], BaseCallbackManager]]) – 压缩过程中运行的回调。

返回

压缩后的文档序列。

返回类型

Sequence[Document]

rerank(documents: Sequence[Union[str, Document, dict]], query: str, *, model: Optional[str] = None, top_n: Optional[int] = -1, max_chunks_per_doc: Optional[int] = None) → List[Dict[str, Any]][源代码]¶

根据查询相关度对提供的文档进行排序。

参数

查询 (str) – 用于重新排序的查询。
文档 (Sequence[Union[str, Document, dict]]) – 要重新排序的文档序列。
模型 (Optional[str]) – 用于重新排序的模型。默认为 self.model。
top_n (Optional[int]) – 返回的结果数量。如果为 None，则返回所有结果。默认为 self.top_n。
max_chunks_per_doc (Optional[int]) – 从文档中衍生出的最大块数。

返回类型

列表[字典[str, 任何类型]]

使用 JinaRerank 的示例¶

Jina 重排器

langchain_community.document_compressors.jina_rerank.JinaRerank¶

使用 JinaRerank 的示例¶

`langchain_community.document_compressors.jina_rerank`.JinaRerank¶