langchain_community.document_loaders.reddit
.RedditPostsLoader¶
- 类 langchain_community.document_loaders.reddit.RedditPostsLoader(client_id: str, client_secret: str, user_agent: str, search_queries: Sequence[str], mode: str, categories: Sequence[str] = ['new'], number_posts: Optional[int] = 10)[源代码]¶
加载 Reddit 帖子。
读取子版块的帖子。首先,您需要访问 https://www.reddit.com/prefs/apps/ 并创建您的应用程序
- 使用client_id、client_secret、user_agent、search_queries、mode、categories、number_posts初始化。
categories(默认:[“new”]),number_posts(默认:10)。
示例: https://www.reddit.com/r/learnpython/
- 参数
client_id (str) – Reddit客户端id。
client_secret (str) – Reddit客户端密钥。
user_agent (str) – Reddit用户代理。
search_queries (Sequence[str]) – 搜索查询。
mode (str) – 模式。
categories (Sequence[str]) – 分类。默认:[“new”]
number_posts (Optional[int]) – 帖子数量。默认:10
方法
__init__
(client_id, client_secret, ...[, ...])使用client_id、client_secret、user_agent、search_queries、mode、categories、number_posts初始化。
Documents的懒加载器。
aload
()将数据加载到Document对象中。
Documents的懒加载器。
load
()加载Reddit。
load_and_split
([text_splitter])加载Documents并分割成块。
- __init__(client_id: str, client_secret: str, user_agent: str, search_queries: Sequence[str], mode: str, categories: Sequence[str] = ['new'], number_posts: Optional[int] = 10)[来源]¶
- 使用client_id、client_secret、user_agent、search_queries、mode、categories、number_posts初始化。
categories(默认:[“new”]),number_posts(默认:10)。
示例: https://www.reddit.com/r/learnpython/
- 参数
client_id (str) – Reddit客户端id。
client_secret (str) – Reddit客户端密钥。
user_agent (str) – Reddit用户代理。
search_queries (Sequence[str]) – 搜索查询。
mode (str) – 模式。
categories (Sequence[str]) – 分类。默认:[“new”]
number_posts (Optional[int]) – 帖子数量。默认:10
- load_and_split(text_splitter: Optional[TextSplitter] = None) List[Document]¶
加载文档并将其分割成段落。段落以文档的形式返回。
不要重写此方法。应考虑将其弃用!
- 参数
text_splitter (可选[TextSplitter]) – 用于分割文档的TextSplitter实例。默认为RecursiveCharacterTextSplitter。
- 返回:
文档列表。
- 返回类型
List[Document]