langchain_community.document_loaders.image_captions.ImageCaptionLoader

class langchain_community.document_loaders.image_captions.ImageCaptionLoader(images: Union[str, Path, bytes, List[Union[str, bytes, Path]]], blip_processor: str = 'Salesforce/blip-image-captioning-base', blip_model: str = 'Salesforce/blip-image-captioning-base')[源代码]

加载图像字幕。

默认情况下,该加载器使用预训练的Salesforce BLIP图像字幕模型。 https://hugging-face.cn/Salesforce/blip-image-captioning-base

使用图像数据列表(bytes)或文件路径进行初始化

参数
  • images (Union[str, Path, bytes, List[Union[str, bytes, Path]]]) – 一个图像或图像列表。接受图像数据(bytes)或图像文件路径。

  • blip_processor (str) – 预训练BLIP处理器的名称。

  • blip_model (str) – 预训练BLIP模型的名称。

方法

__init__(images[, blip_processor, blip_model])

使用图像数据列表(bytes)或文件路径进行初始化

alazy_load()

Document的惰性加载器。

aload()

将数据加载到Document对象中。

lazy_load()

Document的惰性加载器。

load()

从图像数据列表或文件路径中加载

load_and_split([text_splitter])

加载Documents并分割成块。

__init__(images: Union[str, Path, bytes, List[Union[str, bytes, Path]]], blip_processor: str = 'Salesforce/blip-image-captioning-base', blip_model: str = 'Salesforce/blip-image-captioning-base')[源代码]

使用图像数据列表(bytes)或文件路径进行初始化

参数
  • images (Union[str, Path, bytes, List[Union[str, bytes, Path]]]) – 一个图像或图像列表。接受图像数据(bytes)或图像文件路径。

  • blip_processor (str) – 预训练BLIP处理器的名称。

  • blip_model (str) – 预训练BLIP模型的名称。

async alazy_load() AsyncIterator[Document]

Document的惰性加载器。

返回类型

AsyncIterator[Document]

async aload() List[Document]

将数据加载到Document对象中。

返回类型

List[Document]

lazy_load() Iterator[Document]

Document的惰性加载器。

返回类型

Iterator[Document]

load() List[Document][source]

从图像数据列表或文件路径中加载

返回类型

List[Document]

load_and_split(text_splitter: Optional[TextSplitter]) List[Document]

加载文档并将其分割成块。块以文档的形式返回。

不要重写此方法。应考虑将其弃用!

参数

text_splitter (可选[TextSplitter]) – 用于分割文档的TextSplitter实例。默认为RecursiveCharacterTextSplitter。

返回

文档列表。

返回类型

List[Document]

使用ImageCaptionLoader的示例