langchain_community.document_loaders.cassandra
.CassandraLoader¶
- class langchain_community.document_loaders.cassandra.CassandraLoader(table: Optional[str] = None, session: Optional[Session] = None, keyspace: Optional[str] = None, query: Union[str, Statement, None] = None, page_content_mapper: Callable[[Any], str] = <class 'str'>, metadata_mapper: Callable[[Any], dict] = <function CassandraLoader.<lambda>>, *, query_parameters: Union[dict, Sequence, None] = None, query_timeout: Optional[float] = <object object>, query_trace: bool = False, query_custom_payload: Optional[dict] = None, query_execution_profile: Any = <object object>, query_paging_state: Any = None, query_host: Optional[Host] = None, query_execute_as: Optional[str] = None)[source]¶
Apache Cassandra 文档加载器。
- 参数
table (可选[str]) – 从中加载数据的表。(不要与 query 参数一起使用)
session (可选[Session]) – cassandra 驱动器会话。如果没有提供,将使用 cassio 解析的会话。
keyspace (可选[str]) – 表的 keyspace。如果没有提供,将使用 cassio 解析的 keyspace。
query (联合[str, Statement, None]) – 用于加载数据的查询。(不要与 table 参数一起使用)
page_content_mapper (可调用[[Any], str]) – 一个函数,用于将行转换为字符串页面内容。默认值为行的 str 表示形式。
metadata_mapper (可调用[[Any], dict]) – 一个函数,用于将行转换为文档元数据。
query_parameters (联合[dict, Sequence, None]) – 调用 session.execute 时使用的查询参数。
query_timeout (可选[float]) – 调用 session.execute 时使用的查询超时。
query_trace (布尔值) – 在调用 session.execute 时是否使用跟踪。
query_custom_payload (可选[dict]) – 调用 session.execute 时使用的查询 custom_payload。
query_execution_profile (任何) – 调用 session.execute 时使用的查询 execution_profile。
query_host (可选[Host]) – 调用 session.execute 时使用的查询 host。
query_execute_as (可选[str]) – 调用 session.execute 时使用的查询 execute_as。
query_paging_state (任何) –
方法
__init__
([table, session, keyspace, query, ...])Apache Cassandra 文档加载器。
Document 的懒加载器。
aload
()将数据加载到 Document 对象中。
Document 的懒加载器。
load
()将数据加载到 Document 对象中。
load_and_split
([text_splitter])加载文档并将其拆分成块。
- __init__(table: Optional[str] = None, session: Optional[Session] = None, keyspace: Optional[str] = None, query: Union[str, Statement, None] = None, page_content_mapper: Callable[[Any], str] = <class 'str'>, metadata_mapper: Callable[[Any], dict] = <function CassandraLoader.<lambda>>, *, query_parameters: Union[dict, Sequence, None] = None, query_timeout: Optional[float] = <object object>, query_trace: bool = False, query_custom_payload: Optional[dict] = None, query_execution_profile: Any = <object object>, query_paging_state: Any = None, query_host: Optional[Host] = None, query_execute_as: Optional[str] = None) None [source]¶
Apache Cassandra 文档加载器。
- 参数
table (可选[str]) – 从中加载数据的表。(不要与 query 参数一起使用)
session (可选[Session]) – cassandra 驱动器会话。如果没有提供,将使用 cassio 解析的会话。
keyspace (可选[str]) – 表的 keyspace。如果没有提供,将使用 cassio 解析的 keyspace。
query (联合[str, Statement, None]) – 用于加载数据的查询。(不要与 table 参数一起使用)
page_content_mapper (可调用[[Any], str]) – 一个函数,用于将行转换为字符串页面内容。默认值为行的 str 表示形式。
metadata_mapper (可调用[[Any], dict]) – 一个函数,用于将行转换为文档元数据。
query_parameters (联合[dict, Sequence, None]) – 调用 session.execute 时使用的查询参数。
query_timeout (可选[float]) – 调用 session.execute 时使用的查询超时。
query_trace (布尔值) – 在调用 session.execute 时是否使用跟踪。
query_custom_payload (可选[dict]) – 调用 session.execute 时使用的查询 custom_payload。
query_execution_profile (任何) – 调用 session.execute 时使用的查询 execution_profile。
query_host (可选[Host]) – 调用 session.execute 时使用的查询 host。
query_execute_as (可选[str]) – 调用 session.execute 时使用的查询 execute_as。
query_paging_state (任何) –
- 返回类型
None
- load_and_split(text_splitter: Optional[TextSplitter] = None) List[Document] ¶
加载文档并将其分割成块。块作为文档返回。
不要重写此方法。应考虑将其弃用!
- 参数
text_splitter (可选 TextSplitter) – 用于分割文档的 TextSplitter 实例。默认为 RecursiveCharacterTextSplitter。
- 返回
文档列表。
- 返回类型
List[Document]