langchain_community.document_loaders.dataframe.DataFrameLoader

class langchain社区.document_loaders.dataframe.DataFrameLoader(data_frame: Any, page_content_column: str = 'text', engine: Literal['pandas', 'modin'] = 'pandas')[source]

加载 Pandas DataFrame。

用数据帧对象初始化。

参数
  • data_frame (Any) – Pandas DataFrame 对象。

  • page_content_column (str) – 包含页面内容的列名称。默认为 “text”。

  • engine (Literal['pandas', 'modin']) –

方法

__init__(data_frame[, page_content_column, ...])

用数据帧对象初始化。

alazy_load()

Documents 的懒加载器。

aload()

将数据加载到 Document 对象中。

lazy_load()

从数据框中懒加载记录。

load()

将数据加载到 Document 对象中。

load_and_split([text_splitter])

加载 Documents 并将其分割成块。

__init__(data_frame: Any, page_content_column: str = 'text', engine: Literal['pandas', 'modin'] = 'pandas')[source]

用数据帧对象初始化。

参数
  • data_frame (Any) – Pandas DataFrame 对象。

  • page_content_column (str) – 包含页面内容的列名称。默认为 “text”。

  • engine (Literal['pandas', 'modin']) –

async alazy_load() AsyncIterator[Document]

Documents 的懒加载器。

返回类型

AsyncIterator[Document]

异步 aload() List[Document]

将数据加载到 Document 对象中。

返回类型

列表<Document>

lazy_load() 迭代器[Document]

从数据框中懒加载记录。

返回类型

迭代器<Document>

load() List[Document]

将数据加载到 Document 对象中。

返回类型

列表<Document>

load_and_split(text_splitter: Optional[TextSplitter] = None) List[Document]

加载数据并分割为块。块以 Document 的形式返回。

不要重写此方法。应考虑将其弃用!

参数

text_splitter (可选TextSplitter) – 用于切分文档的 TextSplitter 实例。默认为 RecursiveCharacterTextSplitter。

返回

文档列表。

返回类型

列表<Document>

使用 DataFrameLoader 的示例