langchain_community.document_loaders.quip.QuipLoader

class langchain_community.document_loaders.quip.QuipLoader(api_url: str, access_token: str, request_timeout: Optional[int] = 60, *, allow_dangerous_xml_parsing: bool = False)[源代码]

加载 Quip 页面。

基于 https://github.com/quip/quip-api/tree/master/samples/baqup 的端口。

参数

方法

__init__(api_url, access_token[, ...])

参数 api_url

https://platform.quip.com

alazy_load()

文档的懒加载器。

aload()

将数据加载到文档对象中。

get_thread_ids_by_folder_id(folder_id, ...)

通过文件夹 ID 获取线程 ID 并更新到 thread_ids 中。

lazy_load()

文档的懒加载器。

load([folder_ids, thread_ids, max_docs, ...])

参数

param folder_ids: 要加载的特定文件夹 ID 列表,默认为 None

param thread_ids: 要加载的特定线程 ID 列表,默认为 None

param max_docs: 要检索的总文档数最大值,默认 1000

process_thread_images(tree)

process_thread_messages(thread_id)

process_threads(thread_ids, include_images, ...)

将线程列表转换为文档列表。

__init__(api_url: str, access_token: str, request_timeout: Optional[int] = 60, *, allow_dangerous_xml_parsing: bool = False)[源代码]
参数
async alazy_load() AsyncIterator[Document]

文档的懒加载器。

返回类型

AsyncIterator[Document]

async aload() List[Document]

将数据加载到文档对象中。

返回类型

List[Document]

get_thread_ids_by_folder_id(folder_id: str, depth: int, thread_ids: List[str]) None[源代码]

通过文件夹 ID 获取线程 ID 并更新到 thread_ids 中。

参数
  • folder_id (字符串) –

  • depth (整数) –

  • thread_ids (字符串列表) –

返回类型

None

lazy_load() 迭代器[文档]

文档的懒加载器。

返回类型

文档迭代器

load(folder_ids: Optional[List[str]] = None, thread_ids: Optional[List[str]] = None, max_docs: Optional[int] = 1000, include_all_folders: bool = False, include_comments: bool = False, include_images: bool = False) List[Document][source]

参数:

:param folder_ids:要加载数的特定文件夹ID列表,默认为None

:param thread_ids:要加载数的特定线程ID列表,默认为None

参数
  • :param max_docs:总共检索的文档数量上限,默认1000

  • :param include_all_folders:是否包含所有可访问的文件夹(但不含私密文件夹),默认False

  • :param include_comments:是否包含评论,默认False

  • :param include_images:是否包含图片,默认False

  • folder_ids (可选[列表[str]])–

  • thread_ids (可选[列表[str]])–

返回类型

List[Document]

load_and_split(text_splitter: Optional[TextSplitter] = None) List[Document]

加载文档并将其分割成块。块以文档的形式返回。

不要重写此方法。应考虑将其弃用!

参数

text_splitter (Optional[TextSplitter]) – 用于分割文档的 TextSplitter 实例。默认为 RecursiveCharacterTextSplitter。

返回

文档列表。

返回类型

List[Document]

process_thread(thread_id: str, include_images: bool, include_messages: bool) Optional[Document][source]
参数
  • thread_id (str) –

  • thread_ids (可选[列表[str]])–

  • include_messages (bool) –

返回类型

Optional[Document]

process_thread_images(tree: ElementTree) str[source]
参数

tree (ElementTree) –

返回类型

字符串

process_thread_messages(thread_id: str) str[source]
参数

thread_id (str) –

返回类型

字符串

process_threads(thread_ids: Sequence[str], include_images: bool, include_messages: bool) List[Document][源代码]

将线程列表转换为文档列表。

参数
  • thread_ids (序列[字符串]) –

  • thread_ids (可选[列表[str]])–

  • include_messages (bool) –

返回类型

List[Document]

使用QuipLoader的示例