langchain_community.document_loaders.text
.TextLoader¶
- class langchain_community.document_loaders.text.TextLoader(file_path: Union[str, Path], encoding: Optional[str] = None, autodetect_encoding: bool = False)[source]¶
加载文本文件。
- 参数
file_path (Union[str, Path]) – 要加载的文件路径。
encoding (Optional[str]) – 要使用的文件编码。如果为 None,将使用默认系统编码加载文件
encoding。
autodetect_encoding (bool) – 如果指定的编码失败,是否尝试自动检测文件编码。
使用文件路径进行初始化。
方法
__init__
(file_path[, encoding, ...])使用文件路径进行初始化。
Documents的lazy loader。
aload
()将数据加载到Document对象中。
从文件路径加载。
load
()将数据加载到Document对象中。
load_and_split
([text_splitter])加载Documents并将它们拆分成块。
- __init__(file_path: Union[str, Path], encoding: Optional[str] = None, autodetect_encoding: bool = False)[source]¶
使用文件路径进行初始化。
- 参数
file_path (Union[str, Path]) –
encoding (Optional[str]) –
autodetect_encoding (bool) –
- load_and_split(text_splitter: Optional[TextSplitter] = None) List[Document]¶
加载文档并将其分割成块。块作为文档返回。
不要重写此方法。应考虑将其弃用!
- 参数
text_splitter (可选[TextSplitter]) – 用于分割文档的 TextSplitter 实例。默认为 RecursiveCharacterTextSplitter。
- 返回
文档列表。
- 返回类型
列表[文档]