langchain_community.utilities.pubmed.PubMedAPIWrapper

class langchain_community.utilities.pubmed.PubMedAPIWrapper[source]

Bases: BaseModel

PubMed API 的包装器。

这个包装器将使用 PubMed API 进行搜索和获取文档摘要。默认情况下,它将返回输入搜索的 top-k 结果的文档摘要。

参数
  • top_k_results – PubMed 工具使用的最高分文档的数量

  • MAX_QUERY_LENGTH – 查询的最大长度。默认为 300 个字符。

  • doc_content_chars_max – 文档内容的最大长度。如果内容超过这个长度,将被截断。默认为 2000 个字符。

  • max_retry – 请求的最大重试次数。默认为 5。

  • sleep_time – 重试之间的等待时间。默认为 0.2 秒。

  • email – 用于 PubMed API 的电子邮件地址。

通过解析和验证从关键字参数输入的数据来创建一个新模型。

如果输入数据无法解析成有效的模型,则引发 ValidationError。

param MAX_QUERY_LENGTH: int = 300
param base_url_efetch: str = 'https://eutils.ncbi.nlm.nih.gov/entrez/eutils/efetch.fcgi?'
param base_url_esearch: str = 'https://eutils.ncbi.nlm.nih.gov/entrez/eutils/esearch.fcgi?'
param doc_content_chars_max: int = 2000
param email: str = '[email protected]'
param max_retry: int = 5
param sleep_time: float = 0.2
参数 top_k_results: int = 3
lazy_load(query: str) Iterator[dict][source]

在PubMed中搜索与查询匹配的文档。返回包含文档元数据的字典迭代器。

参数

query (str) –

返回类型

Iterator[dict]

lazy_load_docs(query: str) Iterator[Document][source]
参数

query (str) –

返回类型

Iterator[Document]

load(query: str) List[dict][source]

在PubMed中搜索与查询匹配的文档。返回包含文档元数据的字典列表。

参数

query (str) –

返回类型

List[dict]

load_docs(query: str) List[Document][source]
参数

query (str) –

返回类型

List[Document]

retrieve_article(uid: str, webenv: str) dict[源代码]
参数
  • uid (str) –

  • webenv (str) –

返回类型

dict

run(query: str) str[源代码]

执行PubMed搜索并获取文章元信息。参见https://www.ncbi.nlm.nih.gov/books/NBK25499/#chapter4.ESearch,它只使用文章元信息的最有用字段。

参数

query (str) –

返回类型

str