langchain_community.document_loaders.parsers.pdf.extract_from_images_with_rapidocr

langchain_community.document_loaders.parsers.pdf.extract_from_images_with_rapidocr(images: Sequence[Union[Iterable[ndarray], bytes]]) str[源代码]

使用RapidOCR从图像中提取文本。

参数

images (Sequence[Union[Iterable[ndarray], bytes]]) – 要从中提取文本的图像。

返回

从图像中提取的文本。

抛出

ImportError – 如果未安装 rapidocr-onnxruntime 包。

返回类型

str