langchain_community.utilities.pebblo.generate_size_based_batches

langchain_community.utilities.pebblo.generate_size_based_batches(docs: List[Document], max_batch_size: int = 102400) List[List[Document]][source]

根据文档内容大小生成批次的文档。 :param docs: 待分批的文档列表。 :param max_batch_size: 每批的最大字节数。默认为 100*1024 (100KB)

返回

文档批次的列表

返回类型

列表[列表[Document]]

参数
  • docs (List[Document]) –

  • max_batch_size (int) –