langchain_community.document_loaders.rocksetdb
.RocksetLoader¶
- class langchain_community.document_loaders.rocksetdb.RocksetLoader(client: ~typing.Any, query: ~typing.Any, content_keys: ~typing.List[str], metadata_keys: ~typing.Optional[~typing.List[str]] = None, content_columns_joiner: ~typing.Callable[[~typing.List[~typing.Tuple[str, ~typing.Any]]], str] = <function default_joiner>)[source]¶
从Rockset数据库中加载数据。
使用前,应安装好rockset python包。
示例
# This code will load 3 records from the "langchain_demo" # collection as Documents, with the `text` column used as # the content from langchain_community.document_loaders import RocksetLoader from rockset import RocksetClient, Regions, models loader = RocksetLoader( RocksetClient(Regions.usw2a1, "<api key>"), models.QueryRequestSql( query="select * from langchain_demo limit 3" ), ["text"] )
)
使用Rockset客户端进行初始化。
- 参数
client (Any) – Rockset客户端对象。
query (Any) – Rockset查询对象。
content_keys (List[str]) – 要写入Document对象的page_content中的集合列。
metadata_keys (Optional[List[str]]) – 要写入Document对象的metadata中的集合列。默认情况下,这是文档中的所有键。
content_columns_joiner (Callable[[List[Tuple[str, Any]]], str]) – 将content_keys及其值连接成字符串的方法。这是一个接受List[Tuple[str, Any]]]的该方法,代表列名和列值的一对列表。默认情况下,这是每个列值添加一个换行符的方法。该方法只有在有多个content_keys时才相关。
方法
__init__
(client, query, content_keys[, ...])使用Rockset客户端进行初始化。
Documents的懒加载器。
aload
()将数据加载到Document对象中。
Documents的懒加载器。
load
()将数据加载到Document对象中。
load_and_split
([text_splitter])将Documents加载并分割成块。
- __init__(client: ~typing.Any, query: ~typing.Any, content_keys: ~typing.List[str], metadata_keys: ~typing.Optional[~typing.List[str]] = None, content_columns_joiner: ~typing.Callable[[~typing.List[~typing.Tuple[str, ~typing.Any]]], str] = <function default_joiner>)[source]¶
使用Rockset客户端进行初始化。
- 参数
client (Any) – Rockset客户端对象。
query (Any) – Rockset查询对象。
content_keys (List[str]) – 要写入Document对象的page_content中的集合列。
metadata_keys (Optional[List[str]]) – 要写入Document对象的metadata中的集合列。默认情况下,这是文档中的所有键。
content_columns_joiner (Callable[[List[Tuple[str, Any]]], str]) – 将content_keys及其值连接成字符串的方法。这是一个接受List[Tuple[str, Any]]]的该方法,代表列名和列值的一对列表。默认情况下,这是每个列值添加一个换行符的方法。该方法只有在有多个content_keys时才相关。
- propertyasync aload<>() → ListDocument[]¶
将数据加载到Document对象中。
- 返回类型
ListDocument[]
- load<>() → ListDocument[]¶
将数据加载到Document对象中。
- 返回类型
ListDocument[]
- load_and_split(text_splitter: Optional[TextSplitter]= None) → ListDocument[]¶
加载文档并分割成块。块以Document的形式返回。
不要重写此方法。它应该被认为已弃用!
- 参数
text_splitter (Optional[TextSplitter]) – 要用于分割文档的TextSplitter实例。默认为RecursiveCharacterTextSplitter。
- 返回
文档列表。
- 返回类型
ListDocument[]