langchain_community.document_loaders.notebook.NotebookLoader

class langchain_community.document_loaders.notebook.NotebookLoader(path: Union[str, Path], include_outputs: bool = False, max_output_length: int = 10, remove_newline: bool = False, traceback: bool = False)[source]

加载 Jupyter笔记本 (.ipynb) 文件。

用路径初始化。

参数
  • path (Union[str, Path]) – 加载笔记本的路径。

  • include_outputs (bool) – 是否包含单元格的输出。默认值是 False。

  • max_output_length (int) – 显示输出的最大长度。默认值是 10。

  • remove_newline (bool) – 是否从笔记本中删除换行符。默认值是 False。

  • traceback (bool) – 是否返回错误的跟踪堆栈。默认值是 False。

方法

__init__(path[, include_outputs, ...])

用路径初始化。

alazy_load()

Documents 的懒加载器。

aload()

将数据加载到 Document 对象中。

lazy_load()

Documents 的懒加载器。

load()

加载文档。

load_and_split([text_splitter])

加载 Documents 并将其分割成块。

__init__(path: Union[str, Path], include_outputs: bool = False, max_output_length: int = 10, remove_newline: bool = False, traceback: bool = False)[source]

用路径初始化。

参数
  • path (Union[str, Path]) – 加载笔记本的路径。

  • include_outputs (bool) – 是否包含单元格的输出。默认值是 False。

  • max_output_length (int) – 显示输出的最大长度。默认值是 10。

  • remove_newline (bool) – 是否从笔记本中删除换行符。默认值是 False。

  • traceback (bool) – 是否返回错误的跟踪堆栈。默认值是 False。

async alazy_load() AsyncIterator[Document]

Documents 的懒加载器。

返回类型

AsyncIterator [Document]

async aload() List[Document]

将数据加载到 Document 对象中。

返回类型

List [Document]

lazy_load() Iterator[Document]

Documents 的懒加载器。

返回类型

Iterator [Document]

load() okList[Document][source]

加载文档。

返回类型

List [Document]

load_and_split(text_splitter: Optional[TextSplitter] = None) List[Document]

加载文档并将其分割成块。块以Document的形式返回。

不要重写此方法。应将其视为已弃用!

参数

text_splitter (可选TextSplitter) – 用于分割文档的TextSplitter实例。默认为RecursiveCharacterTextSplitter。

返回

文档列表。

返回类型

Document列表[Document]

使用NotebookLoader的示例