langchain_community.document_loaders.telegram.TelegramChatApiLoader

class langchain_community.document_loaders.telegram.TelegramChatApiLoader(chat_entity: Optional[EntityLike] = None, api_id: Optional[int] = None, api_hash: Optional[str] = None, username: Optional[str] = None, file_path: str = 'telegram_data.json')[source]

加载 Telegram 聊天 JSON 目录导出。

使用 API 参数初始化。

参数
  • chat_entity (可选[EntityLike]) – 要从其中获取数据的聊天实体。

  • api_id (可选[int]) – API ID。

  • api_hash (可选[str]) – API 哈希。

  • username (可选[str]) – 用户名。

  • file_path (str) – 要保存数据的文件路径。默认为“telegram_data.json”。

方法

__init__([chat_entity, api_id, api_hash, ...])

使用 API 参数初始化。

alazy_load()

Documents 的懒加载器。

aload()

将数据加载到 Document 对象中。

fetch_data_from_telegram()

从 Telegram API 获取数据并将它保存为 JSON 文件。

lazy_load()

Documents 的懒加载器。

load()

加载文档。

load_and_split([text_splitter])

加载 Documents 并将其分割成块。

__init__(chat_entity: Optional[EntityLike] = None, api_id: Optional[int] = None, api_hash: Optional[str] = None, username: Optional[str] = None, file_path: str = 'telegram_data.json')[source]

使用 API 参数初始化。

参数
  • chat_entity (可选[EntityLike]) – 要从其中获取数据的聊天实体。

  • api_id (可选[int]) – API ID。

  • api_hash (可选[str]) – API 哈希。

  • username (可选[str]) – 用户名。

  • file_path (str) – 要保存数据的文件路径。默认为“telegram_data.json”。

async alazy_load() AsyncIterator[Document]

Documents 的懒加载器。

返回类型

AsyncIterator[Document]

async aload() List[Document]

将数据加载到 Document 对象中。

返回类型

List[Document]

async fetch_data_from_telegram() None[source]

从 Telegram API 获取数据并将它保存为 JSON 文件。

返回类型

None

lazy_load() Iterator[Document]

Documents 的懒加载器。

返回类型

迭代器[文档]

load() List[Document][source]

加载文档。

返回类型

List[Document]

load_and_split(text_splitter: Optional[TextSplitter] = None) List[Document]

加载数据文档并将它们分割成块。块作为文档返回。

不要重写此方法。应考虑将其弃用!

参数

text_splitter (可选[TextSplitter]) – 用于分割文档的TextSplitter实例。默认使用RecursiveCharacterTextSplitter。

返回值

文档列表。

返回类型

List[Document]

使用TelegramChatApiLoader的示例