langchain_community.document_loaders.oracleai.ParseOracleDocMetadata

class langchain_community.document_loaders.oracleai.ParseOracleDocMetadata[source]

解析Oracle文档元数据...

初始化和重置此实例。

如果convert_charrefs为True(默认值),则自动将所有字符引用转换为相应的Unicode字符。

属性

CDATA_CONTENT_ELEMENTS

方法

__init__()

初始化和重置此实例。

check_for_whole_start_tag(i)

clear_cdata_mode()

close()

处理任何缓冲数据。

feed(data)

将数据提供给解析器。

get_metadata()

get_starttag_text()

返回起始标签的完整源代码: '<...>'。

getpos()

返回当前的行号和偏移量。

goahead(end)

handle_charref(name)

handle_comment(data)

handle_data(data)

handle_decl(decl)

handle_endtag(tag)

handle_entityref(name)

handle_pi(data)

handle_startendtag(tag, attrs)

handle_starttag(tag, attrs)

parse_bogus_comment(i[, report])

parse_comment(i[, report])

parse_declaration(i)

parse_endtag(i)

parse_html_declaration(i)

parse_marked_section(i[, report])

parse_pi(i)

parse_starttag(i)

重置()

重置此实例。

set_cdata_mode(elem)

unknown_decl(data)

updatepos(i, j)

__init__() None[来源]

初始化和重置此实例。

如果convert_charrefs为True(默认值),则自动将所有字符引用转换为相应的Unicode字符。

返回类型

None

check_for_whole_start_tag(i)
clear_cdata_mode()
close()

处理任何缓冲数据。

feed(data)

将数据提供给解析器。

根据需要调用此函数,使用尽可能少或尽可能多的文本(可能包括'n')。

get_metadata() Dict[str, Any][来源]
返回类型

Dict[str, Any]

get_starttag_text()

返回开始标签的完整源代码:’<…>’。

getpos()

返回当前的行号和偏移量。

goahead(end)
handle_charref(name)
handle_comment(data)
handle_data(data: str) None[source]
参数

data (str) –

返回类型

None

handle_decl(decl)
handle_endtag(tag)
handle_entityref(name)
handle_pi(data)
handle_startendtag(tag, attrs)
handle_starttag(tag: str, attrs: List[Tuple[str, Optional[str]]]) None[source]
参数
  • tag (str) –

  • attrs (List[Tuple[str, Optional[str]]]) –

返回类型

None

parse_bogus_comment(i, report=1)
parse_comment(i, report=1)
parse_declaration(i)
parse_endtag(i)
parse_html_declaration(i)
parse_marked_section(i, report=1)
parse_pi(i)
parse_starttag(i)
reset()

重置此实例。将丢失所有未处理的数据。

设置_cdata_mode(elem)
未知声明(data)
更新位置(i, j)