langchain_text_splitters
0.2.3¶
langchain_text_splitters.base
¶
类¶
|
编程语言的枚举。 |
|
用于将文本分割成块的应用接口。 |
使用模型分词器将文本分割成标记。 |
|
分词器数据类。 |
函数¶
根据分词器分割传入的文本并返回块。 |
¶
类¶
按字符分割文本。 |
|
递归地按字符分割文本。 |
¶
类¶
元素类型作为类型字典。 |
|
根据指定的标题分割HTML文件。 |
|
根据指定的标签和字体大小分割HTML文件。 |
¶
类¶
¶
类¶
使用Konlpy包分割文本。 |
¶
类¶
|
尝试根据LaTeX格式化布局元素分割文本。 |
langchain_text_splitters.markdown
¶
类¶
一个用于处理Markdown语法的实验性文本分割器。 |
|
将标题类型作为类型化的字典。 |
|
将行类型作为类型化的字典。 |
|
|
根据指定的标题分割Markdown文件。 |
|
尝试根据Markdown格式化标题分割文本。 |
langchain_text_splitters.nltk
¶
类¶
|
使用NLTK包进行文本分割。 |
langchain_text_splitters/python
¶
类¶
|
尝试根据Python语法分割文本。 |
langchain_text_splitters/sentence_transformers
¶
类¶
|
使用句子模型分词器将文本分割成标记。 |
langchain_text_splitters/spacy
¶
类¶
|
使用Spacy包进行文本分割。 |