langchain_community.document_loaders.blob_loaders.file_system.FileSystemBlobLoader

class langchain_community.document_loaders.blob_loaders.file_system.FileSystemBlobLoader(path: Union[str, Path], *, glob: str = '**/[!.]*', exclude: Sequence[str] = (), suffixes: Optional[Sequence[str]] = None, show_progress: bool = False)[源代码]

在本地文件系统中加载数据块。

示例

from langchain_community.document_loaders.blob_loaders import FileSystemBlobLoader
loader = FileSystemBlobLoader("/path/to/directory")
for blob in loader.yield_blobs():
    print(blob)  # noqa: T201

使用目录路径及其glob模式进行初始化。

参数
  • path (Union[str, Path]) – 要从中加载的目录路径或文件路径。如果提供了文件路径,则忽略glob/exclude/suffixes。

  • glob (str) – 默认情况下设置为选择所有非隐藏文件的相对路径的glob模式。

  • exclude (Sequence[str]) – 要从结果中排除的模式,使用glob语法。

  • suffixes (Optional[Sequence[str]]) – 提供以仅保留具有这些后缀的文件。在需要保留不同后缀的文件时很有用。后缀必须包括点,例如“.txt”。

  • show_progress (bool) – 如果为true,则在加载文件时将显示进度条。这强制迭代所有匹配的文件以在加载之前计算它们的数量。

示例

方法

__init__(path, *[glob, exclude, suffixes,...])

使用目录路径及其glob模式进行初始化。

count_matching_files()

计数匹配模式但未加载的文件。

yield_blobs()

输出匹配请求模式的块。

(path: Union[str, Path], *, glob: str = '**/[!.]*', exclude: Sequence[str] = (), suffixes: Optional[Sequence[str]] = None, show_progress: bool = False) None[源代码]

使用目录路径及其glob模式进行初始化。

参数
  • path (Union[str, Path]) – 要从中加载的目录路径或文件路径。如果提供了文件路径,则忽略glob/exclude/suffixes。

  • glob (str) – 默认情况下设置为选择所有非隐藏文件的相对路径的glob模式。

  • exclude (Sequence[str]) – 要从结果中排除的模式,使用glob语法。

  • suffixes (Optional[Sequence[str]]) – 提供以仅保留具有这些后缀的文件。在需要保留不同后缀的文件时很有用。后缀必须包括点,例如“.txt”。

  • show_progress (bool) – 如果为true,则在加载文件时将显示进度条。这强制迭代所有匹配的文件以在加载之前计算它们的数量。

返回类型

None

示例

count_matching_files() int[源代码]

计数匹配模式但未加载的文件。

返回类型

int

yield_blobs() Iterable[Blob][源代码]

输出匹配请求模式的块。

返回类型

Iterable[Blob]

FileSystemBlobLoader 使用示例