深入解析XML中的字符实体与字符数据

所属分类: 网页制作 / XML/XSLT 阅读数: 1029
收藏 0 赞 0 分享

字符实体
在我们了解字符实体之前,先了解一下什么是 XML 实体。

W3 联盟 对实体的定义:文档实体作为实体树的根元素和 XML 处理程序的起点。


这意味着实体就是 XML 中的占位符。它们可以声明在文档序言或者DTD中。实体有不同的类型,本章后面会讨论字符实体。

HTML 和 XML 都有一些符号被保留使用,它们不能在 XML 代码中用作内容。例如,< 和 > 符号被用作 XML 标签的开头和结尾。要显示这些特殊字符,就要使用字符实体。

有些特殊的字符或符号还不能直接使用键盘输入。可以使用字符实体来显示这些符号或特殊字符。

字符实体类型
有三种类型的字符实体:

预定义的字符实体。
编码字符实体。
命名字符实体。
预定义的字符实体

引入它们是为了避免使用某些有歧义的符号。例如,当我们把小于(<)或大于(>)符号当尖括号(<>)使用时就会产生歧义。字符实体从根本上来说就是用来界定 XML 标签的。下面是一个来自 XML 规范的预定义字符实体列表。它们可以用来表示某些字符而不带歧义。

和号: &
单引号: '
大于: >
小于: <
双引号: "
数字字符实体

数字引用被用来表示字符实体。数字引用可以是十进制或十六进制格式。由于有数以千记的数字引用,导致很难记住它们。数字引用通过使用字符在 Unicode 字符集中的编码数值来表示。

十进制数字引用基本语法:

XML/HTML Code复制内容到剪贴板
  1. &# decimal number ;  

十六进制数字引用基本语法:

XML/HTML Code复制内容到剪贴板
  1. &#x Hexadecimal number ;  

下面的表格列出了一些预定义字符实体和它们对应的数值:

实体名称 字符 十进制引用 十六进制引用
quot " &#34; &#x22;
amp & &#38; &#x26;
apos ' &#39; &#x27;
lt &#60; &#x3C;
gt > &#62; &#x3E;

命名字符实体

正如上面所说的,数值字符很难记住,最受欢迎的字符实体类型是命名字符实体。因为每个实体都用一个名称标识。

例如:

'Aacute' 表示带重音符的大写 A 字符。
'ugrave' 表示带沉音符的小写 u。


CDATA 片段
术语 CDATA 就是字符数据。CDATA 被定义为不由解析器解析的文本块,但它被公认为标记。

标记中预定义的实体比如 &lt;,&gt; 和 &amp; 需要手动输入并且通常难以阅读。这种情况下就可以使用 CDATA 片段。通过使用 CDATA 片段,我们可以告诉解析器文档的特定部分不包含标记,应该被当做普通文本对待。

语法
下面是 CDATA 片段的语法:

XML/HTML Code复制内容到剪贴板
  1. <![CDATA[  
  2. characters with markup  
  3. ]]>  

上面的语法由三个部分组成:

CDATA 开始部分 - CDATA 以9个字符的分隔符<![CDATA[开头。
CDATA 结束部分 - CDATA 以 ]]> 分隔符结尾。
CData 部分 - 上面这两个标记之间的字符被解释为字符而不是标记。这个部分可以包含标记字符(<,> 和 &),但是它们会被 XML 处理程序忽略。
示例

下面的标记代码展示了 CDATA。其中写在 CDATA 片段中的字符都会被解析器忽略。

XML/HTML Code复制内容到剪贴板
  1. <script>  
  2. <![CDATA[   
  3. <message> Welcome to TutorialsPoint </message>  
  4. ]] >  
  5. </script>  

在上述的语法中,<message> 和 </message> 之间的所有内容都会被当做字符数据而不是标记。

CDATA 规则
XML CDATA 需要遵循以下规则:

XML 文档任何位置的 CDATA 都不能包含 "]]>" 字符。
CDATA 片段不可以嵌套。

更多精彩内容其他人还在看

网页制作关于代码的18个小技巧

  1、xml文件尽量以utf-8编码,gb2312有些字是存储不了的,如?,就算能存也需要转换,比较麻烦,utf-8也符合国际规范。   2、CSS中:hover这个伪类,如果放在:visited前面则会失效。   3、<a>标签如果没有href属性,所
收藏 0 赞 0 分享

什么是XML?

XML是 EXtensible Markup Language(可扩展标识语言)的简写。 和HTML(Hypertext Markup Language 超文本标记语言)一样,同样来源于SGML. XML 不是 HTML 的替代者,只是HTML的补充,它的用途完全不同
收藏 0 赞 0 分享

数据库生成xml的简单方法

第一个示例方法: 1 SqlConnection conn = new SqlConnection(); 2 conn.ConnectionString = "Server=127.0.0.1;User ID=sa;Password=fdahgdr
收藏 0 赞 0 分享

XML教程:通过一个例子来学习XML的语法

XML的语法规则既很简单,又很严格。这些规则很容易学习,也很容易使用。 正因为如此,创建可读取及操作XML的软件不是一件难事。 一个XML文档的例子 XML使用一种可自我描述的简单的语法。 <?xml version="1.0&q
收藏 0 赞 0 分享

百度新闻开放协议XML文档制作方法简述

开放协议概述 使用此开放协议,将会为您的网站带去更多流量! 《互联网新闻开放协议》是百度新闻搜索制定的搜索引擎新闻源收录标准,网站可将发布的新闻内容制作成遵循此开放协议的XML格式的网页(独立于原有的新闻发布形式)供搜索引擎索引,将网站发布的新闻信息主动、及
收藏 0 赞 0 分享

XML教程:XML有哪些用途?

XML是被设计为存储、传输以及交换数据的。XML不是被设计为用来显示数据的。 XML可以将HTML与数据分离 通过使用XML,您的数据可存储于HTML之外。 当我们使用HTML来显示数据时,数据存储于HTML中。通过使用XML,数据可以被存储在单独的X
收藏 0 赞 0 分享

XML教程:什么是XML及XML和HTML的区别

XML被设计用来描述数据,其焦点是数据的内容。 HTML被设计用来显示数据,其焦点是数据的外观。 应该掌握的基础知识: 在您继续学习之前,需要对以下知识有基本的了解: HTML / XHTML JavaScript or
收藏 0 赞 0 分享

XML中的DTD文档类型定义完全解析

XML标签的自定义功能非常强大,比如本文将要讲解的DTD(Document Type Definition)就带给人们一种面向对象般的感觉,well,下面就来看一下XML中的DTD文件类型定义完全解析
收藏 0 赞 0 分享

了解WEB页面工具语言XML(三)支持工具

三、支持XML的公司和它们的开发工具   尽管XML还处在开发阶段,其标准正在由W3C组织制定,但是已经有许多公司表示全力支持XML,并开发了不少XML工具。Adobe公司的FrameMaker可以用来书写XML文档。Microsoft公司推出的IE 4.0已经可以显示、
收藏 0 赞 0 分享

了解WEB页面工具语言XML(四)应用分类

四、XML应用分类   总的说来的XML的应用可分为四类:   (1)应用于客户需要与不同的数据源进行交互时。数据可能来自不同的数据库,他们都有各自不同的复杂格式。但客户与这些数据库间只通过一种标准语言进行交互,那就是XML。由于XML的自定义性及可扩展性,它
收藏 0 赞 0 分享
查看更多