langchain_community.document_loaders.notebook
.NotebookLoader¶
- class langchain_community.document_loaders.notebook.NotebookLoader(path: Union[str, Path], include_outputs: bool = False, max_output_length: int = 10, remove_newline: bool = False, traceback: bool = False)[source]¶
加载 Jupyter笔记本 (.ipynb) 文件。
用路径初始化。
- 参数
path (Union[str, Path]) – 加载笔记本的路径。
include_outputs (bool) – 是否包含单元格的输出。默认值是 False。
max_output_length (int) – 显示输出的最大长度。默认值是 10。
remove_newline (bool) – 是否从笔记本中删除换行符。默认值是 False。
traceback (bool) – 是否返回错误的跟踪堆栈。默认值是 False。
方法
__init__
(path[, include_outputs, ...])用路径初始化。
Documents 的懒加载器。
aload
()将数据加载到 Document 对象中。
Documents 的懒加载器。
load
()加载文档。
load_and_split
([text_splitter])加载 Documents 并将其分割成块。
- __init__(path: Union[str, Path], include_outputs: bool = False, max_output_length: int = 10, remove_newline: bool = False, traceback: bool = False)[source]¶
用路径初始化。
- 参数
path (Union[str, Path]) – 加载笔记本的路径。
include_outputs (bool) – 是否包含单元格的输出。默认值是 False。
max_output_length (int) – 显示输出的最大长度。默认值是 10。
remove_newline (bool) – 是否从笔记本中删除换行符。默认值是 False。
traceback (bool) – 是否返回错误的跟踪堆栈。默认值是 False。
- load_and_split(text_splitter: Optional[TextSplitter] = None) List[Document] ¶
加载文档并将其分割成块。块以Document的形式返回。
不要重写此方法。应将其视为已弃用!
- 参数
text_splitter (可选:TextSplitter) – 用于分割文档的TextSplitter实例。默认为RecursiveCharacterTextSplitter。
- 返回
文档列表。
- 返回类型
Document列表[Document]