现在的位置: 首页 > 综合 > 正文

XML基础教程

2012年11月29日 ⁄ 综合 ⁄ 共 2778字 ⁄ 字号 评论关闭
文章目录

第一章  XML概述

  1.1标记语言概述

  1.2HTML及其局限

    1.2.1HTML文档范例

    1.2.2HTML文档基本架构

    1.2.3HTML文档常用标记

    1.2.4HTML的局限

  1.3XML解决方案

    1.3.1XML的实现机制

    1.3.2XML的文档实例

    1.3.3XML的官方目标

  1.4XML的特点

    1.4.1XML的优势

    1.4.2XML与Java

    1.4.3XML的不足

  1.5XML的应用

    1.5.1XML的应用领域

    1.5.2XML的延伸语言

    1.5.3XML的其他应用

  1.6XML的相关技术

 

在标记电子文档方面,最早成为国际标准的标记语言是结构化通用标记语言(SGML)

目前最流行的标记语言是超文档标记语言(HTML)

而有着广泛应用前景的是可扩展性标记语言(XML)

SGML

SGML前期由IBM开发,1986年ISO国际标准化组织批准GML为国际标准,并正式命名为SGML,是用于定义其他语言的元语言

它以结构化和逻辑化来描述文本化文档.

一个SGML由语法定义,文档类型定义和文档实例3个部分组成

语法定义部分为文档类型和文档实例定定义了语法结构

文档类型定义部分定义了文档实例的逻辑结构和元素类型

文档实例部分则包含了该文档的所有数据元素,是SGML的主体部分

正如其名称 所言,SMGL是一种采用标记醚描述文档数据的通用语言,SMGL定义了基本的语法,但也允许用户建立自己的元素标记.要利用SMGL来描述特定文档,用户必须创造出一组适当的元素标记.例如,要描述有关书籍信息的文档,就可能需要命名并使用名为BOOK,PART,CHAPTER,INTRODUCTION,SECTION等的元素标记.

SGML是与平台无关的,结构化的,可扩展的标记语言,SGML文档包含了一系列的DTD(Document type Definition,文档类型定义的内容),而在DTD中则定义了各种标记的含义,因而SGML的语法是可以扩展的.

SGML文档虽然在美国军方及航天业界使用多年,然而,W3C中的成员却认为SGML过于复杂和麻烦,

难以学习和掌握,致使无法实现有效率地在网络上传递信息.SGML的过多弹性与其他一些特性,让编定

负责在浏览器中处理与显示SGML信息的软件变得非常困难,鉴于这些原因,WEB发明者欧洲粒子物理实验室的研究人员

根据当时的情况,在SGML的基础上提出了超文本标记语言.

 

HTML(Hyper Text Markup Language,超文本标记语言),是目前网络上应用最广泛的语言,也是构成网页文档的主要语言

1989年,欧洲粒子物理实验室的研究人员Tim Berners Lee 开发了一个基于SGML的超文本简化版本,也不需要DTD,因而其语法也是不可扩展的.HTML这种因定的语法使其易

用,开发用来处理HTML的浏览器也十分容易,并很快从计算机界走向全社会,并最终走向千家万户

HTML使用各种定义好的标记来分别标识和格式化不同的网页元素,使得网页制作与WEB信息发布变得非常简单.现在一个普通人员元需了解HTML语法就可以使用各种所见即所得的THML编辑器,如Dreamweaver,FrontPage等,进行web页面的创作.HTML已经成为最主要的WEB页面语言

缺点

然而,以目前的发展来看,HTML却存在着相当大的局限性,由于标准的HTML标记已经由W3C预先确定,不能根据需要自行定义,所以当描述具有各种复杂内容的文档时,HTML就显得力不从心

,另外,HTML面向的是数据格式的描述,而非面向数据对象本身,因此HTML标记并没有给出数据内容的含义.

  使用目前的HTML,网页文档开发者必须要对文档进行许多的调整才能兼容各种流行的浏览器,除此之外,由于浏览器不去检查页面的中错语HTML代码,因而导致Internet上有大量的文档包含错语的HTML语法,这个问题越来越严重,于是W3C开始寻找解决方案,XML则是最发的选择.

 

XML

XML(eXtensible Markup Language)即可扩展标记语言,它与HTML一样,都是出自于SGML标准通用标记语言,XML是internet环境中跨平台的,依敕于内容的技术,在当前处理结构化文档信息的有力工具.在W3C领导的工作小组开发并支持XML技术,使用它来标记和处理通过互联网传输的文档信息

1998年,W3C发布了XML1.0规范,如同SGML一样,XML让人们在描述特殊文档时可以创造自己的元素标记,此外,XML的语法提供了

SGML少得多的选 项,从而 使人们可以更容易的创建和阅读XML文档,并且让程序设计人员更容易编写出用来处理和显示XML文档信息的应用程序和浏览器软件

XML是年轻的元语言(定义标记语言的语言),人们在其基础上已经开发了适合各个领域内部文档发布的数据交换的XML应用标准,比如说数学标记语言MathML,化学标记语言CML,无线标记语言WML等

XML不仅可以用来描述网络上的新型文档格式,而且适用于描述任何结构化或者半结构化的数据,结构化的数据 包括数据库中的数据 ,电子表格数据,程序配置信息,半结构化的数据则包括web页面,商务文档和各种领域的专业文档等

XML不仅满足了WEB内容发布与交换的需要,而且适合作为各种数据存储与共享的通用平台,oracle,ibm以及microsoft公司者积极地投入人力和财力,研发与xml相关的软件

这无疑确定了XML在IT业界内的美好前景.例如MICROSOFT公司的MICROSOFT OFFICE,MICROSOFT sql server 和microsoft.net framework都允许开发者和终端用

户使用XML作为网络信息和其他数据的保存与传输方式.

XML具有如下一些特点:

XML是SGML的简化版本,它继承了SGML的许多优点

XML揭示了数据本身的含义,因为XML文档可用来清楚的描述,储存,和共享各种数据.

XML是可扩展,人们可以创建自己的文档元素以满足WEB创作的需要

XML是跨平台的,它不依赖任何一种程序证言,操作系统和软件开发商,因而可以作为各种语言和各种系统平台数据交换的桥梁.

XML是结构化的,因此它不仅能够描述文档中各种数据的含义而且能够描述整个文档的逻辑结构.

XML是基于文本的,它可以用任何一种文本编辑工具来阅读和编辑修改,又因为它是基于unicode的,所以是多语种兼容的

XML的数据与其显示格式是分离的,因而同一个XML文档可以适用于各种不同的显示设备和显示方式

因为XML文档具有良好的格式与逻辑结构,XML应用软件可采用简单的原则来区分文档中的数据与XML标记,因此程序员可以很容易的编写相应软件来访问XML文档.

抱歉!评论已关闭.