langchain_community.document_loaders.reddit.RedditPostsLoader

langchain_community.document_loaders.reddit.RedditPostsLoader(client_id: str, client_secret: str, user_agent: str, search_queries: Sequence[str], mode: str, categories: Sequence[str] = ['new'], number_posts: Optional[int] = 10)[源代码]

加载 Reddit 帖子。

读取子版块的帖子。首先,您需要访问 https://www.reddit.com/prefs/apps/ 并创建您的应用程序

使用client_id、client_secret、user_agent、search_queries、mode、categories、number_posts初始化。

categories(默认:[“new”]),number_posts(默认:10)。

示例: https://www.reddit.com/r/learnpython/

参数
  • client_id (str) – Reddit客户端id。

  • client_secret (str) – Reddit客户端密钥。

  • user_agent (str) – Reddit用户代理。

  • search_queries (Sequence[str]) – 搜索查询。

  • mode (str) – 模式。

  • categories (Sequence[str]) – 分类。默认:[“new”]

  • number_posts (Optional[int]) – 帖子数量。默认:10

方法

__init__(client_id, client_secret, ...[, ...])

使用client_id、client_secret、user_agent、search_queries、mode、categories、number_posts初始化。

alazy_load()

Documents的懒加载器。

aload()

将数据加载到Document对象中。

lazy_load()

Documents的懒加载器。

load()

加载Reddit。

load_and_split([text_splitter])

加载Documents并分割成块。

__init__(client_id: str, client_secret: str, user_agent: str, search_queries: Sequence[str], mode: str, categories: Sequence[str] = ['new'], number_posts: Optional[int] = 10)[来源]
使用client_id、client_secret、user_agent、search_queries、mode、categories、number_posts初始化。

categories(默认:[“new”]),number_posts(默认:10)。

示例: https://www.reddit.com/r/learnpython/

参数
  • client_id (str) – Reddit客户端id。

  • client_secret (str) – Reddit客户端密钥。

  • user_agent (str) – Reddit用户代理。

  • search_queries (Sequence[str]) – 搜索查询。

  • mode (str) – 模式。

  • categories (Sequence[str]) – 分类。默认:[“new”]

  • number_posts (Optional[int]) – 帖子数量。默认:10

async alazy_load() AsyncIterator[Document]

Documents的懒加载器。

返回类型

AsyncIterator[Document]

async aload() List[Document]

将数据加载到Document对象中。

返回类型

列表[Document]

lazy_load() Iterator[Document]

Documents的懒加载器。

返回类型

迭代器[Document]

load() List[Document][源代码]

加载Reddit。

返回类型

列表[Document]

load_and_split(text_splitter: Optional[TextSplitter] = None) List[Document]

加载文档并将其分割成段落。段落以文档的形式返回。

不要重写此方法。应考虑将其弃用!

参数

text_splitter (可选[TextSplitter]) – 用于分割文档的TextSplitter实例。默认为RecursiveCharacterTextSplitter。

返回:

文档列表。

返回类型

List[Document]

使用RedditPostsLoader的示例