XML标记语言的基本概念及语法入门教程

所属分类: 网页制作 / XML/XSLT 阅读数: 703
收藏 0 赞 0 分享


XML 表示可扩展标记语言。它是一种基于文本的标记语言,源自标准通用标记语言(SGML)。

XML 标签标识数据以及用于存储和组织数据,而不是指定如何显示它,像 HTML 一样用于显示数据。不久的将来 XML 并不会取代 HTML,但是它通过采用许多 HTML 中成功的特性引入了可能性。

这里有 XML 的三个重要特点,这使得它对各种各样的系统和解决方案都有用:

XML 是可扩展:XML 允许我们创建自己的适合应用程序的自描述标签或者语言。
XML 承载数据,但不呈现它:XML 允许我们存储数据,不管它会如何呈现。
XML 是一个公共标准:XML 有叫做万维网联盟(W3C)的组织开发,并且它可以作为一个开放标准。


XML 的用途
这个 XML 用途的简短列表说明了一切:

XML 可以在幕后工作以简化为大型网站创建 HTML 文档。
XML 可以用来在组织和系统之间交换信息。
XML 可以用来卸载和重新加载数据库。
XML 可以用来存储和整理数据,还可以自定义数据处理需求。
XML 很容易合并样式表创建几乎任何想要的输出。
实际上,任何类型的数据都可以被表示为 XML 文档。


什么是标记?
XML 是一种标记语言,它定义了一组按照人类可读和机器可读的格式编码文档的规则。那么究竟什么是标记语言? 标记就是添加给文档以某种方式改善其意义的信息,它标识部分以及彼此之间如何关联。更具体来说,标记语言就是一组符号,它可以放置到文档的文本中划分和标记文档的某些部分。

下面这个例子展示了嵌入一块文本的 XML 标记看起来是什么样子:

XML/HTML Code复制内容到剪贴板
  1. <message>  
  2.     <text>Hello, world!</text>  
  3. </message>  

这个片段包含标记符号或者说是标签,比如 <message>...</message> 和 <text>... </text>。标签 <message> 和 </message> 表示这个 XML 代码片段的开始和结束。标签 <text> 和 </text> 包裹着文本 Hello world!。

XML 是编程语言吗?
一门用于创建计算机程序的编程语言由语法规则和它自己的词汇表组成。这些程序指示计算机执行特定的任务。XML 并不具备成为一种编程语言的资格,因为它不执行任何计算或者算法。它通常存储在简单的文本文件中,并通过能够解释 XML 的特殊软件处理。

XML 语法
下面是一个完整的 XML 文档:

XML/HTML Code复制内容到剪贴板
  1. <?xml version="1.0"?>  
  2. <concat-info>  
  3. <name>Tanmay Patil</name>  
  4. <company>TutorialsPoint</company>  
  5. <phone>(011) 123-4567</phone>  
  6. </concat-info>  

你可以注意到上面的例子中有两种类型的信息:

标记,比如 <concat-info>。
文本或者字符数据,比如 _Tutorials Point和(011) 123-4567_。
下图描述了在 XML 文档中编写不同类型标记和文本的语法规则:
201624115950687.png (427×303)

我们来详细看看上图中的每个组成部分:

XML 声明
XML 文档可以有一个可选的 XML 声明。它可以写作如下形式:

<?xml version="1.0" encoding="UTF-8"?>
这里 version 就是 XML 版本,encoding 指定文档中使用的字符编码。

XML 声明的语法规则

XML 声明区分大小写,必须以 "<?xml>" 开头,其中 "xml" 是小写的。
如果文档包含 XML 声明,那么它必须是 XML 文档的第一条语句。
XML 声明必须是 XML 文档的第一条语句。
可以使用一个 HTTP 协议覆盖 XML 声明中指定的 encoding 的值。


标签和元素
一个 XML 文件的结构由几个 XML 元素组成,也叫做 XML 节点或 XML 标签。XML 元素的名称使用尖括号 < > 闭合,如下所示:

<element>
标签和元素的语法规则

元素语法: 每个 XML 元素都必须闭合或者带有开始和结束元素,如下所示:

<element>....</element>
或者简写形式,就像这样:

<element/>
元素嵌套: 一个 XML 元素可以包含多个 XML 元素作为它的子元素,但是子元素不能重叠。比如,一个元素的结束标签必须与最近匹配的开始标签具有相同的名称。

下面的例子展示了不正确的嵌套标签:

XML/HTML Code复制内容到剪贴板
  1. <?xml version="1.0"?>  
  2. <contact-info>  
  3. <company>TutorialsPoint   
  4. <contact-info>  
  5. </company>  

下面的例子展示了正确的嵌套标签:

XML/HTML Code复制内容到剪贴板
  1. <?xml version="1.0"?>  
  2. <contact-info>  
  3. <company>TutorialsPoint</company>  
  4. <contact-info>  

根元素: 一个 XML 文档只有一个根元素。例如,下面是一个不正确的 XML 文档,因为 x 和 y 元素出现在顶层而没有一个根元素:

XML/HTML Code复制内容到剪贴板
  1. <x>...</x>  
  2. <y>...</y>  

下面的例子展示了正确形式的 XML 文档:

<root>
    <x>...</x>
    <y>...</y>
</root>
区分大小写: XML 元素的名称区分大小写。这意味着元素的起始和结束标签大小写必须一样。

例如 <contact-info> 和 __<Contact-Info> 就不同。

属性
attribute 使用名/值对给元素指定一个属性(property)。一个 XML 元素可以有一个或多个属性(attributes)。例如:

XML/HTML Code复制内容到剪贴板
  1. <a href="http://www.tutorialspoint.com/">Tutorialspoint!</a>  

这里 href 就是属性名称,而 http://www.tutorialspoint.com/ 就是属性值。

XML 属性的语法规则

XML 属性名区分大小写(和 HTML 不一样)。也就是说 HREF 和 href 会被认为是两个不同的 XML 属性。
在语法中相同的属性不能有两个。下面的例子展示了不正确的语法,因为属性 b 被指定了两次:

XML/HTML Code复制内容到剪贴板
  1. <a b="x" c="y" b="z">....</a>  

属性名定义不带引号标记,而属性值必须显示在引号标记中。下面的例子演示了不正确的 XML 语法:

XML/HTML Code复制内容到剪贴板
  1. <a b=x>....</a>  

在上面的语法中,属性值没有定义在引号标记中。

XML 引用
引用 通常允许我们在 XML 文档中添加或包含附加的文本。引用始终以符号 "&" 开始,这是一个保留字符,以符号 ";" 结尾。XML 中有两种类型的引用:

实体引用: 一个实体引用的起始和结束定界符之间包含一个名称。比如 &amp;,其中 amp 就是名称。这个 name 通常指向一个预定义的文本字符串或标记。

字符引用: 这些包含引用比如 &#65; 包含一个 hash 标记("#"),后面紧跟一个数字。这个数字始终指向一个字符的 Unicode 码。在这里,65 指向字母 "A"。

XML 文本
XML 元素和 XML 属性的名称区分大小写。这意味着元素的开始和结束标签大小写必须一致。
为了避免字符编码的问题,所有的 XML 文件都应该保存为 Unicode UTF-8 或者 UTF-16 文件。
空白字符,比如空格,制表符以及 XML 元素和 XML 属性之间换行符会被忽略。
有些字符是 XML 语法本身保留的。因此,不能直接使用它们。要使用它们,就要使用一些替代实体。下面列出了一些:
201624120118759.png (353×219)

更多精彩内容其他人还在看

初学XML的基础知识(认识XML的作用)

“可扩展标记语言”(XML) 提供一种描述结构化数据的方法。与主要用于控制数据的显示和外观的 HTML 标记不同,XML 标记用于定义数据本身的结构和数据类型。 XML 使用一组标记来描绘数据元素。每个元素封装可能十分简单也可能十分复杂的数据。您可
收藏 0 赞 0 分享

使用XML实现多渠道接入网站的构架

  其实写这篇文章的目的最多的想法是把自己在去年在瑞士做项目时应用的一个框架给展现出来让大家共享,但我又有点担心我的表达能力不能将我在里面使用的思想很好的表现出来,所以迟迟 不敢下笔,最后还是下了决心,写吧, 不行就在好好改改,当然也希望大家多提些意见。
收藏 0 赞 0 分享

学习XML关于图像超链接的制作

这是我今天学习的时候遇到的另一个问题,做图像超链接要把链接地址放到<a>的href属性中去,可是这就是在标签中套标签,是不可以的,查了《Web编程实做教程》,才知道正确的解决方案,现在与大家分享。 此段代码运行需要两张图片:a.gif和b.gif。 my
收藏 0 赞 0 分享

Microsoft的XMLHTTP对象介绍

MSXML中提供了Microsoft.XMLHTTP对象,能够完成从数据包到Request对象的转换以及发送任务。 创建XMLHTTP对象的语句如下: Set objXML = CreateObject("Msxml2.XMLHTTP") 或 Set
收藏 0 赞 0 分享

了解WEB页面工具语言XML(六)展望

六、XML展望   任何一项新技术的产生都是有其需求背景的,XML的诞生是在HTML遇到不可克服的困难之后。近年来HTML在许多复杂的Web应用中遇到了问题,要彻底解决这些问题,必须用功能强大的XML来替代HTML作为Web页面的书写工具。XML有利于信息的表达和结构化组
收藏 0 赞 0 分享

了解WEB页面工具语言XML(五)好处

五、XML带来的好处   (1)更有意义的搜索   数据可被XML唯一的标识。没有XML,搜索软件必须了解每个数据库是如何构建的。这实际上是不可能的,因为每个数据库描述数据都是不同的。有了XML,书就可以很容易以标准的方式按照作者、标题、ISBN序号或其他的标准分
收藏 0 赞 0 分享

用XML将机器内码转换为人们容易理解的信息

  程序中通常会有一些错误代码或标识,为了程序中方便这些东西通常不会使用汉字,经常在程序中用的是一些FileError或数字。还有就是在编码中经常使用的枚举标识对象的状态。而通常这些信息会直接的或间接的现实给用户,可用户需要到的是容易理解的汉字描述。以前要么将这
收藏 0 赞 0 分享

历数Firefox2.0对XML处理的改进

Firefox 2.0 在对 XML 的支持方面有几个重要的改进。目前它的用户部署如日中天。了解 Firefox 2.0 XML 特性的改进,包括在 RSS Web 提要处理方面有争议的变化。 被赋予新应用程序平台的角色后,现在 Web 浏览器可能是最热门的软件。对于软件开
收藏 0 赞 0 分享

将XML数据转换成HTM

使用一个简单的XSL样式表就可以将XML数据转换成HTML。随着XML规范的不断演进,在新的版本中满足每个人的需要似乎已经成为必要;假设有一个表示一个页面内容的XML数据,现在想将其内容转换成布局。下面是想要转换的XML:
收藏 0 赞 0 分享

(javascript+asp)XML、XSL转换输出HTML

Javascript客户端转换 [code] <html> <body> <script language="javascript"> // Load XML var xml = new ActiveXObject
收藏 0 赞 0 分享
查看更多