結構化標記處理工具¶
Python 支援多種模組來處理各種形式的結構化資料標記。這包括處理標準通用標記語言 (SGML) 和超文字標記語言 (HTML) 的模組,以及幾個用於處理可擴充套件標記語言 (XML) 的介面。
html
— 超文字標記語言支援html.parser
— 簡單的 HTML 和 XHTML 解析器html.entities
— HTML 通用實體的定義- XML 處理模組
xml.etree.ElementTree
— ElementTree XML APIxml.dom
— 文件物件模型 APIxml.dom.minidom
— 最小 DOM 實現xml.dom.pulldom
— 支援構建部分 DOM 樹xml.sax
— SAX2 解析器支援xml.sax.handler
— SAX 處理程式的基類ContentHandler
DTDHandler
EntityResolver
ErrorHandler
LexicalHandler
feature_namespaces
feature_namespace_prefixes
feature_string_interning
feature_validation
feature_external_ges
feature_external_pes
all_features
property_lexical_handler
property_declaration_handler
property_dom_node
property_xml_string
all_properties
- ContentHandler 物件
- DTDHandler 物件
- EntityResolver 物件
- ErrorHandler 物件
- LexicalHandler 物件
xml.sax.saxutils
— SAX 實用程式xml.sax.xmlreader
— XML 解析器的介面xml.parsers.expat
— 使用 Expat 的快速 XML 解析ExpatError
error
XMLParserType
ErrorString()
ParserCreate()
- XMLParser 物件
Parse()
ParseFile()
SetBase()
GetBase()
GetInputContext()
ExternalEntityParserCreate()
SetParamEntityParsing()
UseForeignDTD()
SetReparseDeferralEnabled()
GetReparseDeferralEnabled()
buffer_size
buffer_text
buffer_used
ordered_attributes
specified_attributes
ErrorByteIndex
ErrorCode
ErrorColumnNumber
ErrorLineNumber
CurrentByteIndex
CurrentColumnNumber
CurrentLineNumber
XmlDeclHandler()
StartDoctypeDeclHandler()
EndDoctypeDeclHandler()
ElementDeclHandler()
AttlistDeclHandler()
StartElementHandler()
EndElementHandler()
ProcessingInstructionHandler()
CharacterDataHandler()
UnparsedEntityDeclHandler()
EntityDeclHandler()
NotationDeclHandler()
StartNamespaceDeclHandler()
EndNamespaceDeclHandler()
CommentHandler()
StartCdataSectionHandler()
EndCdataSectionHandler()
DefaultHandler()
DefaultHandlerExpand()
NotStandaloneHandler()
ExternalEntityRefHandler()
- ExpatError 異常
- 示例
- 內容模型描述
- Expat 錯誤常量
codes
messages
XML_ERROR_ASYNC_ENTITY
XML_ERROR_ATTRIBUTE_EXTERNAL_ENTITY_REF
XML_ERROR_BAD_CHAR_REF
XML_ERROR_BINARY_ENTITY_REF
XML_ERROR_DUPLICATE_ATTRIBUTE
XML_ERROR_INCORRECT_ENCODING
XML_ERROR_無效的_TOKEN
XML_ERROR_文件元素後存在垃圾資料
XML_ERROR_XML處理指令位置錯誤
XML_ERROR_沒有元素
XML_ERROR_記憶體不足
XML_ERROR_引數實體引用
XML_ERROR_不完整的字元
XML_ERROR_遞迴實體引用
XML_ERROR_語法錯誤
XML_ERROR_標籤不匹配
XML_ERROR_未關閉的_TOKEN
XML_ERROR_未定義的實體
XML_ERROR_未知的編碼
XML_ERROR_未關閉的_CDATA_節
XML_ERROR_外部實體處理錯誤
XML_ERROR_非獨立
XML_ERROR_意外的狀態
XML_ERROR_實體在引數實體中宣告
XML_ERROR_該特性需要_XML_DTD
XML_ERROR_解析後無法更改特性
XML_ERROR_未繫結的字首
XML_ERROR_取消宣告字首
XML_ERROR_不完整的引數實體
XML_ERROR_XML宣告錯誤
XML_ERROR_文字宣告錯誤
XML_ERROR_公共識別符號錯誤
XML_ERROR_已暫停
XML_ERROR_未暫停
XML_ERROR_已中止
XML_ERROR_已完成
XML_ERROR_暫停引數實體
XML_ERROR_保留字首_xml
XML_ERROR_保留字首_xmlns
XML_ERROR_保留的名稱空間_URI
XML_ERROR_無效的引數
XML_ERROR_沒有緩衝區
XML_ERROR_放大限制違規