深入解析XML中的字符实体与字符数据

所属分类: 网页制作 / XML/XSLT 阅读数: 1013
收藏 0 赞 0 分享

字符实体
在我们了解字符实体之前,先了解一下什么是 XML 实体。

W3 联盟 对实体的定义:文档实体作为实体树的根元素和 XML 处理程序的起点。


这意味着实体就是 XML 中的占位符。它们可以声明在文档序言或者DTD中。实体有不同的类型,本章后面会讨论字符实体。

HTML 和 XML 都有一些符号被保留使用,它们不能在 XML 代码中用作内容。例如,< 和 > 符号被用作 XML 标签的开头和结尾。要显示这些特殊字符,就要使用字符实体。

有些特殊的字符或符号还不能直接使用键盘输入。可以使用字符实体来显示这些符号或特殊字符。

字符实体类型
有三种类型的字符实体:

预定义的字符实体。
编码字符实体。
命名字符实体。
预定义的字符实体

引入它们是为了避免使用某些有歧义的符号。例如,当我们把小于(<)或大于(>)符号当尖括号(<>)使用时就会产生歧义。字符实体从根本上来说就是用来界定 XML 标签的。下面是一个来自 XML 规范的预定义字符实体列表。它们可以用来表示某些字符而不带歧义。

和号: &
单引号: '
大于: >
小于: <
双引号: "
数字字符实体

数字引用被用来表示字符实体。数字引用可以是十进制或十六进制格式。由于有数以千记的数字引用,导致很难记住它们。数字引用通过使用字符在 Unicode 字符集中的编码数值来表示。

十进制数字引用基本语法:

XML/HTML Code复制内容到剪贴板
  1. &# decimal number ;  

十六进制数字引用基本语法:

XML/HTML Code复制内容到剪贴板
  1. &#x Hexadecimal number ;  

下面的表格列出了一些预定义字符实体和它们对应的数值:

实体名称 字符 十进制引用 十六进制引用
quot " &#34; &#x22;
amp & &#38; &#x26;
apos ' &#39; &#x27;
lt &#60; &#x3C;
gt > &#62; &#x3E;

命名字符实体

正如上面所说的,数值字符很难记住,最受欢迎的字符实体类型是命名字符实体。因为每个实体都用一个名称标识。

例如:

'Aacute' 表示带重音符的大写 A 字符。
'ugrave' 表示带沉音符的小写 u。


CDATA 片段
术语 CDATA 就是字符数据。CDATA 被定义为不由解析器解析的文本块,但它被公认为标记。

标记中预定义的实体比如 &lt;,&gt; 和 &amp; 需要手动输入并且通常难以阅读。这种情况下就可以使用 CDATA 片段。通过使用 CDATA 片段,我们可以告诉解析器文档的特定部分不包含标记,应该被当做普通文本对待。

语法
下面是 CDATA 片段的语法:

XML/HTML Code复制内容到剪贴板
  1. <![CDATA[  
  2. characters with markup  
  3. ]]>  

上面的语法由三个部分组成:

CDATA 开始部分 - CDATA 以9个字符的分隔符<![CDATA[开头。
CDATA 结束部分 - CDATA 以 ]]> 分隔符结尾。
CData 部分 - 上面这两个标记之间的字符被解释为字符而不是标记。这个部分可以包含标记字符(<,> 和 &),但是它们会被 XML 处理程序忽略。
示例

下面的标记代码展示了 CDATA。其中写在 CDATA 片段中的字符都会被解析器忽略。

XML/HTML Code复制内容到剪贴板
  1. <script>  
  2. <![CDATA[   
  3. <message> Welcome to TutorialsPoint </message>  
  4. ]] >  
  5. </script>  

在上述的语法中,<message> 和 </message> 之间的所有内容都会被当做字符数据而不是标记。

CDATA 规则
XML CDATA 需要遵循以下规则:

XML 文档任何位置的 CDATA 都不能包含 "]]>" 字符。
CDATA 片段不可以嵌套。

更多精彩内容其他人还在看

初学XML的基础知识(认识XML的作用)

“可扩展标记语言”(XML) 提供一种描述结构化数据的方法。与主要用于控制数据的显示和外观的 HTML 标记不同,XML 标记用于定义数据本身的结构和数据类型。 XML 使用一组标记来描绘数据元素。每个元素封装可能十分简单也可能十分复杂的数据。您可
收藏 0 赞 0 分享

使用XML实现多渠道接入网站的构架

  其实写这篇文章的目的最多的想法是把自己在去年在瑞士做项目时应用的一个框架给展现出来让大家共享,但我又有点担心我的表达能力不能将我在里面使用的思想很好的表现出来,所以迟迟 不敢下笔,最后还是下了决心,写吧, 不行就在好好改改,当然也希望大家多提些意见。
收藏 0 赞 0 分享

学习XML关于图像超链接的制作

这是我今天学习的时候遇到的另一个问题,做图像超链接要把链接地址放到<a>的href属性中去,可是这就是在标签中套标签,是不可以的,查了《Web编程实做教程》,才知道正确的解决方案,现在与大家分享。 此段代码运行需要两张图片:a.gif和b.gif。 my
收藏 0 赞 0 分享

Microsoft的XMLHTTP对象介绍

MSXML中提供了Microsoft.XMLHTTP对象,能够完成从数据包到Request对象的转换以及发送任务。 创建XMLHTTP对象的语句如下: Set objXML = CreateObject("Msxml2.XMLHTTP") 或 Set
收藏 0 赞 0 分享

了解WEB页面工具语言XML(六)展望

六、XML展望   任何一项新技术的产生都是有其需求背景的,XML的诞生是在HTML遇到不可克服的困难之后。近年来HTML在许多复杂的Web应用中遇到了问题,要彻底解决这些问题,必须用功能强大的XML来替代HTML作为Web页面的书写工具。XML有利于信息的表达和结构化组
收藏 0 赞 0 分享

了解WEB页面工具语言XML(五)好处

五、XML带来的好处   (1)更有意义的搜索   数据可被XML唯一的标识。没有XML,搜索软件必须了解每个数据库是如何构建的。这实际上是不可能的,因为每个数据库描述数据都是不同的。有了XML,书就可以很容易以标准的方式按照作者、标题、ISBN序号或其他的标准分
收藏 0 赞 0 分享

用XML将机器内码转换为人们容易理解的信息

  程序中通常会有一些错误代码或标识,为了程序中方便这些东西通常不会使用汉字,经常在程序中用的是一些FileError或数字。还有就是在编码中经常使用的枚举标识对象的状态。而通常这些信息会直接的或间接的现实给用户,可用户需要到的是容易理解的汉字描述。以前要么将这
收藏 0 赞 0 分享

历数Firefox2.0对XML处理的改进

Firefox 2.0 在对 XML 的支持方面有几个重要的改进。目前它的用户部署如日中天。了解 Firefox 2.0 XML 特性的改进,包括在 RSS Web 提要处理方面有争议的变化。 被赋予新应用程序平台的角色后,现在 Web 浏览器可能是最热门的软件。对于软件开
收藏 0 赞 0 分享

将XML数据转换成HTM

使用一个简单的XSL样式表就可以将XML数据转换成HTML。随着XML规范的不断演进,在新的版本中满足每个人的需要似乎已经成为必要;假设有一个表示一个页面内容的XML数据,现在想将其内容转换成布局。下面是想要转换的XML:
收藏 0 赞 0 分享

(javascript+asp)XML、XSL转换输出HTML

Javascript客户端转换 [code] <html> <body> <script language="javascript"> // Load XML var xml = new ActiveXObject
收藏 0 赞 0 分享
查看更多