浅谈XML代码编写的编码与验证问题

所属分类: 网页制作 / XML/XSLT 阅读数: 2069
收藏 0 赞 0 分享

编码

编码就是转换 Unicode 字符为等价二进制表示的过程。XML 处理程序读取一个 XML 文档时,它依赖于编码类型来编码文档。因此,我们需要在 XML 声明中指定编码类型。

编码类型
主要有两种类型的编码:

UTF-8
UTF-16
UTF 表示 UCS 转换格式,而 UCS 本身的意义是通用字符集。编号 8 或者 16 表示呈现字符的比特数。它们是 8(一个字节)或者 16(两个字节)。对于没有编码信息的文档,默认使用 UTF-8。

语法
编码信息包含在 XML 文档的序言部分。UTF-8 编码的语法如下:

XML/HTML Code复制内容到剪贴板
  1. <?xml version="1.0" encoding="UTF-8" standalone="no" ?>  

UTF-16 编码语法如下:

XML/HTML Code复制内容到剪贴板
  1. <?xml version="1.0" encoding="UTF-16" standalone="no" ?>  

示例

下面的例子展示了编码声明:

XML/HTML Code复制内容到剪贴板
  1. <?xml version="1.0" encoding="UTF-8" standalone="no" ?>  
  2. <contact-info>  
  3.     <name>Tanmay Patil</name>  
  4.     <company>TutorialsPoint</company>  
  5.     <phone>(011) 123-4567</phone>  
  6. </contact-info>  

在上面的 encoding="UTF-8" 示例中,指定使用 8 位表示字符。要使用 16 为表示字符,可以使用 UTF-16 编码。

使用 UTF-8 编码的 XML 文件尺寸比 UTF-16 格式的文件更小。

验证

验证 就是对 XML 文档进行验证的过程。如果文档内容与元素,属性和关联的文档类型定义(DTD)匹配,以及文档符合b表达的约束则该文档被认为是有效的。通过 XML 解析器处理验证的方式有两种。分别是:

格式良好的 XML 文档
有效的 XML 文档
格式良好的 XML 文档
如果 XML 文档遵守以下规则则被认为是格式良好的。

没有 DTD 的 XML 文档必须使用预定义的字符实体处理 amp(&),apos(单引号),g(>),quot(双引号)。
必须遵循标签的顺序,比如内部标签必须在外部标签闭合之前闭合。
每个开始标签必须都有一个结束标签或者必须是一个自闭合标签(<title>...</title> 或者 <title />)。
在开始标签中必须只能有一个属性,并且需要使用引号包裹。
除了amp(&),apos(单引号),g(>),quot(双引号)实体之外其他的必须先声明再使用。
示例

下面是一个格式良好的 XML 文档示例:

XML/HTML Code复制内容到剪贴板
  1. <?xml version="1.0" encoding="UTF-8" standalone="yes" ?>  
  2. <!DOCTYPE address   
  3. [   
  4. <!ELEMENT address (name,company,phone)>  
  5.     <!ELEMENT name (#PCDATA)>  
  6.     <!ELEMENT company (#PCDATA)>  
  7.     <!ELEMENT phone (#PCDATA)>  
  8. ]>  
  9. <address>  
  10.     <name>Tanmay Patil</name>  
  11.     <company>TutorialsPoint</company>  
  12.     <phone>(011) 123-4567</phone>  
  13. </address>  

上面的示例被认为是格式良好的,因为:

它定义了文档类型。并且这里文档类型是元素类型。
包含一个名为 address 的根元素。
每个子元素 name,company 和 phone 都是一个自解释正确闭合的标签。
标签的顺序正确。

更多精彩内容其他人还在看

WAP教程(2):WAP 基础-XML/XSLT

WAP 的主页与 HTML 的主页非常不同。用于 WAP 的标记语言是 WML (Wireless Markup Language)。WML 使用标签 - 类似 HTML - 但是语法更严格且遵守 XML 1.0 标准。 WAP 主页 W
收藏 0 赞 0 分享

WAP教程(9):WML 实例-XML/XSLT

带有两个卡片的一个卡片组 - 一个供用户输入,一个供显示结果 - 正如本例中展示的. 带有两个卡片的一个卡片组 - 一个供用户输入,一个供显示结果 - 正如本例中展示的: <?xml version="1.0"
收藏 0 赞 0 分享

WAP教程(1):WAP 简介-XML/XSLT

WAP 协议被设计用来在无线客户端(比如移动电话)上展示因特网内容。 WAP 协议被设计用来在无线客户端(比如移动电话)上展示因特网内容。 您应当具备的基础知识 在继续学习之前,您需要对下面的知识有基本的了
收藏 0 赞 0 分享

XML入门教程:XSLT-XML/XSLT

XSLT是XSL的一部份,它是XML的一种应用,指定将一篇XML文档转换成另一种XML文档的规则。XSLT文档即是一篇XML文档,也是一个样式表,里面包含一系列的模板。XSLT处理器对输入XML文档中的元素和样式表中的模板进行比较,如果匹配,则将该模板的内
收藏 0 赞 0 分享

XMLHTTPRequest对象-XML/XSLT

XmlHttp是一套可以在Javascript、VbScript、Jscript等脚本语言中通过http协议传送或从接收XML及其他数据的一套API。XmlHttp最大的用处是可以更新网页的部分内容而不需要刷新整个页面。 1、XMLHTTPReque
收藏 0 赞 0 分享

XML入门教程:CSS样式表-XML/XSLT

样式表可帮我们解释XML文档中各元素的具体意思,所以通过样式表可直接在浏览器上显示XML文档。在XML文档在序言部分通过xml-stylesheet处理指令可指定关联的样式表。xml-stylesheet指令必须有一个href属性和type属性。href指向样式表的URL,typ
收藏 0 赞 0 分享

XML入门教程:XPath-XML/XSLT

XPath是一种用来从文档树中选择节点和节点集的语言。从XPath的角度来看,共有七种节点:根节点、元素节点、属性节点、文本节点、注释节点、处理指令节点、名称空间节点。 XPath是一种用来从文档树中选择节点和节点集的语言。从
收藏 0 赞 0 分享

XML入门教程:XHTM

XHTML是W3C推荐的一种标准,它定义了一种与XML兼容的HTML版本。XHTML文档是一个有效的XML文档,所以编写格式比HTML严格。 XHTML是W3C推荐的一种标准,它定义了一种与XML兼容的HTML版本。XHTML文档是一个有效的XML
收藏 0 赞 0 分享

XML入门教程:XLink-XML/XSLT

XLink是一种基于属性的语法,用来在XML文档中添加链接。XLink链接可以是单向的,如HTML中的A元素,它也可以是双向的,在两个方向上链接两篇文档,因此能够从A到B或从B到A。每个XLink元素必须具有一个xlink:type属性,指出连接类型。属性xlink:h
收藏 0 赞 0 分享

XML入门教程:分析XM

分析XML文档可通过程序来做,分析器有两大类,一种是事件驱动的,一种是基于树模型的。 分析XML文档可通过程序来做,分析器有两大类,一种是事件驱动的,一种是基于树模型的。 使用事件驱动的分析器时,每
收藏 0 赞 0 分享
查看更多