langchain_text_splitters.json.RecursiveJsonSplitter

class langchain_text_splitters.json.RecursiveJsonSplitter(max_chunk_size: int = 2000, min_chunk_size: Optional[int] = None)[源代码]

方法

__init__([max_chunk_size, min_chunk_size])

create_documents(texts[, convert_lists, ...])

从一组JSON对象(字典)中创建文档。

split_json(json_data[, convert_lists])

将JSON分割成多个JSON片段

split_text(json_data[, convert_lists, ...])

将JSON分割为JSON格式的字符串列表

参数
  • max_chunk_size (int) –

  • min_chunk_size (可选[int]) –

__init__(max_chunk_size: int = 2000, min_chunk_size: Optional[int] = None)[源代码]
参数
  • max_chunk_size (int) –

  • min_chunk_size (可选[int]) –

create_documents(texts: List[Dict], convert_lists: bool = False, ensure_ascii: bool = True, metadatas: Optional[List[dict]] = None) List[Document][source]

从一组JSON对象(字典)中创建文档。

参数
  • texts (列表[字典]) –

  • convert_lists (布尔值) –

  • ensure_ascii (布尔值) –

  • metadatas (可选[列表[字典]]) –

返回类型

列表[Document]

split_json(json_data: Dict[str, Any], convert_lists: bool = False) List[Dict][source]

将JSON分割成多个JSON片段

参数
  • json_data (字典[字符串, 任何类型]) –

  • convert_lists (布尔值) –

返回类型

列表[字典]

split_text(json_data: Dict[str, Any], convert_lists: bool = False, ensure_ascii: bool = True) List[str][源代码]

将JSON分割为JSON格式的字符串列表

参数
  • json_data (字典[字符串, 任何类型]) –

  • convert_lists (布尔值) –

  • ensure_ascii (布尔值) –

返回类型

字符串列表

使用RecursiveJsonSplitter的示例