现在的位置: 首页 > 综合 > 正文

xslt入门

2012年02月07日 ⁄ 综合 ⁄ 共 10736字 ⁄ 字号 评论关闭
文章目录
XML在更多的时候只是一种数据文件,怎样将它变为我们日常所看到的HTML格式那样的文件呢?如果我们将XML文件比作结构化的原料的话,那么XSL就好比“筛子“与“模子“,筛子选取自己需要的原料,这些原料再通过模子形成最终的产品:HTML。

  这个模子大致是这样:我们先设计好表现的页面,再将其中需要从XML中获取数据来填充内容的部分“挖掉“,然后用XSL语句从XML中筛出相关的数据来填充。一言以譬之:这XSL实际上就是HTML的一个“壳子“,XML数据利用这个“壳“来生成“传统“的HTML。

  XML在展开时是一个树形结构,我们将树形结构中自定义标记称为节点,节点之间存在父子、兄弟关系,我们要访问其中的结点从根结点就要以”/”来层层进入。

  在XSL这个壳中,我们要从原料库??XML里提取相关的数据,就要用到XSL提供的模式化查询语言。所谓模式化查询语言,就是通过相关的模式匹配规则表达式从XML里提取数据的特定语句,即我们上所说的“筛子“。

参考微软的”XSL开发者指南”,我们大致可将模式语言分为三种:

选择模式

、,和

测试模式

匹配模式

我们现在就分别对之进行介绍。

一、 选择模式

  选择模式语句将数据从XML中提取出来,是一种简单获得数据的方法,这几个标记都有一个select属性,选取XML中特定的结点名的数据。

1、

如在XML中有这样的数据:

小禹

春华

秋实

  我们要读取这三个作者名字,是一个一个地按”author/name”方法来读取吗,可有多个这样的name呀?如果有一种程序性的语句来循环读取有多好啊!

  想得很对,XSL提供了这样的具有程序语言性质的语句

  用它读取这三个作者名字的方法如下:

…….

select,顾名思义:选取,它可以选定XML中特定唯一的标记,也可以选择某一类相同的标记,我们称之为结点集。

语法:

属性:

1. select

  根据XSL样式查询考察上下文以决定哪类结点集(满足select条件)使用此样式描述。作为一种简化的表示就是,如果你想对文档中的某一种标记的内容的显示方式进行格式化,就可以将让select等于此元素的标记名。例如欲对标记xml_mark进行格式化,即可用如下方式表示:

2. order-by

  以分号(;)分隔、作为排序标准的列表。在列表元素前添加加号(+)表示按此标记的内容以升序排序,添加减号(-)表示逆序排序。作为一种简化的表示就是,排序标准列表就是由select规定的标记的子标记的序列,每个标记之间以(;)分隔。

2、

模式只是选取节点,并没有取出节点的值,好比猴子只是爬到了树的某个枝干上,那么就用来摘“胜利果实“吧!

语法:

提取节点的值

属性:

select用来与当前上下文匹配的XSL式样。简单的讲,如果要在XSL文档某处插入某个XML标记(假定是xml_mark标记)的内容,可用如下方式表示:

示例:

  此处仍以上期的个人简历的作为例子,我们需要对文件(个人简历.xml)作一定修改,确切的说是将其中的第二行

修改为

然后建立一个新文件:resume.xsl,其内容如下:

个人简历

个人简历

姓名

性别

生日

技能

  完成这些以后再来让我们看一下辛勤劳动的成果,怎么样?效果不错吧。更酷还在后头呢。现在我们对文件(个人简历.xml)作进一步的修改:

1. 在标记前添加一个新标记;

2. 将标记对之间的内容(包括这一对标记)复制并粘贴在其后,并在最后用结束。

3. 以Notepad.exe打开文件resume.xsl,在标记之后添加文字:;在标记之前添加文字:,保存文件。

4. 在浏览器中打开文件(个人简历.xml)。看到了什么?两份个人简历!

  就这样,利用XML我们可以编写内容与样式完成分离的文档!当然,XSL文件比一般的HTML文件要复杂一些,然而一旦完成则可用于格式化所有同类的XML文档。

XSL模板与匹配模式

  经过前几日的学习,我们学习了XHTML文档的编写和以及三个XSL元素,已能编写相当灵活的XSL文档,今天将学习的是XSL模板的编写。我们都知道,短的文档、程序十分好读,但当规模增大后,其复杂性也以更快的速度增加。

  前面我们学了、等,可以用它们对XML数据实现简单的格式化输出,但如果遇到比较复杂的XML格式输出,将XSL按照要求依次写下来的话,一是设计困难,可扩展性差,不利于人员之间的分工协作;另则,可修改性很差,可能会出现牵一发而动全军的情况,不利于维护。程序中模块化设计逐步细化的方法在这里得到了应用!

  XSL模板将XSL的设计细化成一个个模板(块),最后再将这些模板(块)组合成一个完整的XSL;好比船与集装箱,我们不是将所有的货物一件件地堆起来,而是装在各自的集装箱中,然后再在船上将这些集装箱堆放起来。这种方法可以使你先从整体上考虑整个XSL的设计,然后将一些表现形式细化成不同的模块,再具体设计这些模块,最后将它们整合在一起,这样,将宏观与微观结合起来,符合人们条理化、规范化要求。

装集装箱??书写模板(块):

语法:

属性:

match —— 确定什么样的情况下执行此模板。作为一种简化的说明,在此处使用标记的名字;其中最上层模板必须将match设为“/”

language —— 确定在此模板中执行什么脚本语言,其取值与HTML中的SCRIPT标记的LANGUAGE属性的取值相同,缺省值是Jscript

用match属性从XML选取满足条件的节点,征对这些特定的节点形成一个特定输出形式的模板。

吊集装箱上船-??调用模板(块):

语法:

属性:

select —— 确定在此上下文环境中应执行什么模板,即选取用标记建立的模板(块)。

order-by —— 以分号(;)分隔的排序标准,通常是子标记的序列

示例:

  以个人简历为例,为便于处理我们希望“技能”中每一项都用标记对括起来,有多少项技能就有多少个这种标记对,经过修改后的个人简历XML文档内容如下:

禹希初

1977.5

数据库设计与维护

WEB开发

  然后,建立一个新XSL文件resume_template.xsl,采用模板的形式,其内容如下:

个人简历

个人简历(

formatIndex(childNumber(this), "I")

技能

姓名

性别

生日

  保存文件,打开文件(个人简历.xml),效果令人满意吧。其实要做到同样的效果,用前面三周介绍的方法也可做,但你得把它作为一整体考虑。

  在上面的XSL文件中,我们将性别、生日、技能等数据项分别用模板来单独写,再用来调用,这样,即使你日后要对这些模板作相应的修改与扩充也很方便,不致于出现互相干扰、混杂不清的情况。这种从上至下、逐层细化的设计方法,极大地减少工作复杂程度,也大大减少了差错的产生,可以实现多人的协作设计。

注意:

  如果XML文档中不同标记有同名的子标记,在为其编写模板时,应把父标记作为其前缀,格式为(parent_mark/child_mark)。

  模板文件必须有一个根模板,其属性match是“/”。

注:如果拷贝源代码,请将空格删除

跟我学XSL(四) (返回标题)

2000-05-06· 禹希初·CPCW

测试模式

  XML技术的优势之一就在于数据输出的可选择性,即选择需要的数据输出。前面我们所讲到的选择模式语句:只是简单的选取通过”/”符号层层到达的节点,如果我们对XML数据不需要全部输出,而只需要其中的满足某条件的部分数据,“萝卜青菜、各取所需“,那么条件判断与多条件判断则迎合了这种需要,如果你对程序设计熟悉的话,会觉得它们似曾相识。

XSL中的IF,首先,介绍XSL元素的语法结构:

语法:

属性:

  expr ——脚本语言表达式,计算结果为“真”或“假”;如果结果为“真”,且通过test,则在输出中显示其中内容(可省略此项属性)。

  language ——expr属性中表达式的脚本语言类型,其取值与HTML标记SCRIPT的LANGUAGE属性的取值相同,缺省为“JScript”test ——源数据测试条件。

示例:

此处以一份报表为例,文件名为report.xml,其内容如下:

甲班

50703010

乙班

20304050

丙班

70402010

  我们采用XSL模板结合今天所学的,为其编写一个XSL文档,要求季度产量小于等于20的用红色表示,文件名为report.xsl,内容如下:


说明:

q1|q2|q3|q4 ——标记q1、q2、q3、q3均用此模板确定输出

$le$ ——是关系运算符中的“小于等于”,其它关系有小于($lt$)、大于($gt$)、大于等于($ge$)、等于($eq$)、不等于($ne$)等

. ——表示引用当前标记

[ ] ——表示筛选,只有满足筛选条件的标记才能被选取

value() ——XSL函数,其他常用XSL函数有text()、end()、index()等。

  下期,我们将学习XSL的另外三个元素,可对同一数据进行多次测试,根据不同条件产生相应输出。

跟我学XSL(五) (返回标题)

2000-05-07· 禹希初·CPCW

XSL中的choose

  上期我们学习了XSL元素,已能通过测试XML数据的值来决定不同的输出形式(不知你尝试过没有,实际上也可部分实现的功能),但有时,我们希望对同一数据同时测试多个条件,根据不同条件输出相应结果。当然,我们可以用if,假如我们只有if可用的话。幸好我们有一个更好的选择,那就是用。下面介绍相关元素的语法:

语法:

属性:无,表示一个多选测试的开始

语法:

属性:

expr —— 脚本语言表达式,计算结果为“真”或“假”;如果结果为“真”,且通过test,则在输出中显示其中内容(可省略此项属性)。

language —— expr属性中表达式的脚本语言类型,其取值与HTML标记SCRIPT的LANGUAGE属性的取值相同,缺省为“JScript”。

test —— 源数据测试条件。

语法:

属性:无,在一个多选测试中,如果没有不满足规定的条件,如果在最后有此标记,则输出此标记中的内容。

示例:

  此处以学生成绩单为例,要求按成绩的高低给出优秀( >85)、一般(70~85)、起格(60~69)、不及格(

大胖80

9090

小花98

7085

  为实现按分数分等级显示,其XSL文档(文件名:grade.xsl)内容如下:

成绩单

姓名 英语数学化学

优秀

一般

起格

不起格

说明:

  在选择中,从第一个开始,逐个测试,直到满足一个测试条件就将其中的内容输出,不再测试后面的条件;如果不满足任何一个条件,则输出中的内容。

  标记对与中可嵌套或。

注:如果拷贝源代码,请将空格删除

运算符、关系与逻辑运算符,特殊字符等

  今天我们学习XSL的各种运算符,满足编写更大灵活性的XSL样式的要求。

表一、运算符与特殊字符

运算符 描述

/ 选择子元素,返回左侧元素的直接子元素;如果“/”位于最左侧表示选择根结点的直接子元素

// 递归下降,不论深度,搜索指定的元素;如果位于最左侧表示从根结点出发递归下降搜索指定元素

. 表示当前元素

* 通配符,选择任意元素,不考虑名字

@ 取得属性值,作为属性名的前缀

@* 通配符,选择任意属性,不考虑名字

: 名字作用范围分隔符,将名字作用范围前缀与元素或属性名分隔开来

!* 在相关节点上应用指定方法

( )* 分组,明确指定优先顺序

[ ] 应用过滤样式

[ ]* 下标运算符,用于在集合中指示元素

表二、逻辑运算符

比较运算符 可选方式 描述

and $and$或 逻辑与

or $or$或|| 逻辑或

not() $not$ 逻辑非

表三、关系运算符

= $eq$ 相等

= $ieq$ 相等(不区分大小写)

!= $ne$ 不等

$ine$ 不等(不区分大小写)

$gt$ 大于

$igt$ 大于(不区分大小写)

>= $ge$ 大于等于

$ige$ 大于等于(不区分大小写)

$all$ 集合运算符,如果集合中所有项目均满足条件则返回“真”

$any$ 集合运算符,如果集合中任意项目满足条件则返回“真”

| 集合运算符,返回两个集合的联合

示例一:

  从个人简历中寻找具有具有“WEB开发”技能的人的姓名与E-Mail。假设文档结构如下所示:

name

sex

birthday

skill1

skill2

skilln

  为从以上结构的个人简历中寻找出所有具有“WEB开发”技能的人的姓名与E-Mail的XSL文档结构如下:

姓名E-Mail

说明:

1.[ ] ———表示选择条件,只有满足条件的个人简历才被显示;

2.$any$ ——由于每个人有多种技能,故加$any$作为前缀,以使每个人所有技能都能被比较;

3.skill=’WEB开发’ ——筛选条件

示例二、

  仍上面的XML文档为例,如果欲选择1977/1/1之前出生的人的姓名、技能与E-Mail,相应的XSL文档结构如下(假定生日格式为yyyy/mm/dd):

姓名技能E-Mail

0]" >、

说明:

1. birthday $lt$ ’1977/1/1’ —— 搜索条件,在此处使用“0]———表示选择skill的第二项以后(包括第二项)的项目

4. xsl:value-of select="." ——— 表示选择当前标记的值

  相信大家应该注意到,在前面以及本次的例子中出现了一些函数,如index()、formatIndex()、childNumber(),也许大家还不完全明了其中的含义吧?敬请关注下一课。

注:如果拷贝源代码,请将空格删除

跟我学XSL(七) (返回标题)

2000-05-09· 禹希初·CPCW

XSL函数一

  本期学习XSL样式方法,即可用于XSL元素、、的select属性、的match属性、、的test属性中,对元素的范围进行筛选,从而提供更大的灵活性。

  XML与DHTML(动态HTML)一样,这些节点都是一个个对象,而且这些对象都是有层次的,从根节点开始构成一颗层次清淅的树状结构,这就形成了文档对象模型DOM,通过对象的属性、方法来达到访问控制XML节点的目的。

  我们这里不打算就XML的DOM逐一详细阐述,因为这完全可以写成一个篇幅较多的教程,我们先就一些常见的方法作一些讨论,以期对DOM的对象方法有一个大致的了解。

  注:从本期开始,所有示例不再提供完整源代码,如有不明白之处,请仔细阅读前面七期、并动手练手。

一、end()

含义:返回集合中最后一个元素。

示例:输出最后一份简历

假定XML文件格式为:

……………………

相应XSL文件内容为:

……

……

……

二、index()

含义:返回该元素在集合中的位置,返回值是一整数,其中第一个元素返回0

示例:返回前面三份简历

resume[index() $le$ 3]

注意:index()是与父元素相关的,请看下例:

返回所有中的第一个

x/y[index()=0] 或x/y[0]

三、nodeName()

含义:返回元素的名字,即标记名

示例:选择任意元素,假如其名字(即标记名)等于“name”

*[nodeName()=’name’] 或 *[name]

四、number()

含义:将值转换为数值形式,如果不是数值则返回空,要求参数

示例:年龄(age)小于30岁的人的简历(resume)

resume[number(age) $lt$ 30] 或resume[age $lt$ 30]

五、nodeType()

含义:返回结点类型,结果为是数值。以下是返回值列表:

结点类型 结点类型值 结点的字符形式描述

Element 1 ’element’

Element Attribute 2 ’attribute’

Markup-Delimited Region of Text 3 ’text’

Processing Instruction 7 ’processing_instruction’

Comment 8 ’comment’

Document Entity 9 ’document’

六、value()

含义:返回元素或属性的值

示例:value()是元素或属性的缺省方法,以下表示是等价

name!value()="NAME"与name="NAME"

@attr="attribute_value"与@attr="attribute_value"

注:@是属性前缀,@attr表示是属性attr

七、attribute()

含义:返回所有属性结点的集合,等价于“@*”

示例:寻找所有的resume元素,满足条件至少有一个属性的值为“ABC”

resume[$any$ attribute()=’ABC’]或resume[$any$ @*=’ABC’]

寻找所有的resume元素,满足条件至少有一个子元素有一个属性的值为“ABC”

resume[$any$ */attribute()=’ABC’]或resume[$any$ */@*=’ABC’]

八、comment()

含义:返回所有注释结点

示例:例如

resume[$any$ comment()=’禹希初的简历’]

表示寻找含有注释语句

的元素

九、cdata()

含义:返回所有CDATA类型的结点的集合

示例:例如

resume[$any$ cdata()=’禹希初的简历’]

表示寻找含有下述语句(必须是直接子结点)

的元素

十、node()

含义:返回当前上下文环境中除根结点和属性结点以外的所有结点的集合,等价于

“* | pi() | comment() | text()”

示例:寻找所有元素resume,其最后一个结点的名字为"skill"

resume[node()[end()]!nodeName()=’skill’]

寻找所有resume元素的第一个结点:resume/node()[0]

十一、textnode()

含义:返回所有文本类型的结点的集合

示例:寻找每一个p元素的第二个文本结点

p/textnode(1)或p!textnode(1)

十二、text()

含义:返回所有表示文本字符串的结点的集合,等价于"cdata()|textnode()";

  本期的内容就介绍至此,另有一个函数date()在本人的机器上一试就发生错误使浏览器自动关闭,还有一个函数pi()本人尚未找到适当的应用方法,就不介绍了,下期将讲述如何XSL中使用脚本。

跟我学XSL(八) (返回标题)

2000-05-10· 禹希初·CPCW

脚本与XSL的结合及应用

有时,我们可能会希望XML文档输出时能对其中内容加上一些统计信息或者如编号什么,利用前面的知识就不太容易实现了。今天将介绍两个新元素与,使我们能轻松处理这个难题。

含义:

计算脚本表达式,输出一个文本字符串

语法:

属性:

language —— 规定所用脚本语言的名字,可用的属性有“javascript”、“JScript”、“VBScript”、“VBS”等,缺省为“JScript”。

含义:

声明全局变量或定义函数。

语法:

属性:

示例:

  不知大家对于第四期《跟我学XML》中的例子是否还有印象?其中的XML文档并没有对简历编号,但输出中却加上了大写的罗马数字序号。今天将再举一稍为复杂一些的例子:

  假如我们编写一份年终生产统计表,其中需要小计一项,常规的作法是事先将其算出来,现在不必了,我们可以只给出单项统计,显示时再统计小计一项。请找出《跟我学XML》的第五期,XML文件不必修改,对XSL文件的修改如下:

……

……

小计

total(this,"q1")

total(this,"q2")

total(this,"q3")

total(this,"q4")

function total(node,q){

temp=0;

mark=’/document/report/’+q;

v=node.selectNodes(mark);

for(t=v.nextNode();t;t=v.nextNode()){

temp+=Number(t.text);

}

return temp; //小计值

}

说明:

  黑体部分为添加部分,注意添加部分分为两部分,必须置于之后,切记。

selectNodes() —— 是XMLDOMObject的一个方法,返回文档中所有满足条件的结点的集合,条件与和select属性的取值采用同样的写法,可以加筛选、下标等限制,如:

寻找一季度产量大于等于50的班组

/document/report/q1[value() $ge$ 50]

以上写法还有一个更简单的写法

//q1[value() $ge$ 50]

//表示从根结点出发遍历所有结点,寻找满足条件的结点,如果文档内有同名但意义不同的结点则不能用此种方法,非不得已不建议使用。以此为例,如果希望统计年总产量,则可以下述字符串寻找结点(建议使用最后一种,此种描述将精确找到需要汇总的数据)

//*[value() $gt$ 0]

//(q1|q2|q3|q4)

/document/report/(q1|q2|q3|q4)

nextNode() —— 返回结点集中的下一个结点

Number() —— 将提供的参数转换为数值

  下期介绍XSL函数2,用于及中,以及和的expr属性。建议读者熟悉javascript、JScript、VBScript中至少一种,否你能用XSL完成的工作将十分有限。由于篇幅关系,此处不作详细介绍。

注:如果拷贝源代码,请将空格删除

XLink介绍

2000-03-02· 蔡依纯 译·中文XML

  如果在这个世界上每部电脑中的每个资料块都能够被识别、定址及连结,那将是多么令人振奋的事呢!Xink就是说明如何在网络上做到这点的规格文件。

  HTML的连结

  由於WWW的风行,大部分的人都熟悉超文字连结的基本观念,亦即是“一个连结具有两个端点及一个方向,两个端点我们通常称为Anchor。这个连结可以从一个起点连到任何一个网路资源的目标点,这些连结可能是一张图片,一卷影片,一段声音,一个程式,一篇HTML的文件,或其中的元素等等”。

  假如你常使用浏览器,你一定会知道,当你在连结上按滑鼠的右键时,就会出现一个选单,而其中一个选择是“在新视窗开启”。

  在HTML中,对於这些连结都是用一个「Anchor」的标志所做成。

  如果你是撰写HTML的高手,你一定知道在head标志里有个特别的标志叫做link,它提供了多种的连结功能:比方像是连结到样式表(新的浏览器会提供使用者多一点选择,让其自行选择使用哪一个样式表),或是连结到有音乐的地方(当下载完毕后可自动地播放),抑或是连结到另一个网页(可使浏览器预先载入该网页,以省去等待的时间)等。

  以上所描述的都是连结的功能,事实上,有很多其他的超文字连结功能是HTML没有办法做到的,即使如早期(1960年末至1970年初期)的超文字连结系统所提供的连结功能,HTML亦没办法做到。然而,HTML之所以会成功,是因为它使用最简单的方式去使用超连结,而且使用者并不 要特别的编辑器(Editor)便可制作网页。

  多用途的连结!

  有时当我们看到「连结」时,我们发现其实它看起并不像是连结,但事实上,为什么呢?许多的事物包括电子化地址、识别字、位址或是查询等,都可以有连结这个动作。当你想到两个资料间有“relationship”、“role”、“pointer”或是“has a”等关联性时,在XML(eXtensibleMarkupLanguage)中我们可以用「连结」的方法来加以标示。

  读者们应有一个观念,在HTML4.0规格中,所定义的超文字连结标准,并不是就是连结的所有特性,所以在这里我们将对连结做更清楚的定义:

  1.一个连结可以有一个、二个甚至是很多个ends,而每一个end都可以是指标,事实上连结本身可以很明确地指定是外部(externally)连结,因而连接到每一个end。

  2.一个连结并不 一定要有方向,但它也可以有很多或是没有方向,除此之外,连结的方向不 要一定得从“context”到“part”才行。

  3.连结的end可以是某一范围,不一定是要连结到整个resource或某一地方。

  4.连结点的表现方式乃视连结资料的角色而定,「撷取」和「取代」只是可能性的行为之一。是故,使用者设定连结为撷取资料并取代画面只是连结功能的表现之一。

  XML连结对我们有什么用呢?简言之,像是资料模型化、资料交换、超文字连结或是任何不同关系的资料型态上,都可以派上用场。

  XLinks有一重要功能就是建立「topicmaps」,这是一种依据metadata连结到种种不同网路资源的方式。Topicmaps允许不同的资料有外在的注解(External Annotation)。因此,我们可以说Topicmaps是有结构性的metadata,而依据各特性关联主题,可以连结到不同的网路资源。

  XLinks

XLink定义了几种常用的连结型态:Simple、Extended、Group和Document。

1.Simple的用法比较接近在HTML内a标志的用法(如下HTML的写法所示)。

2.Extended的用法包含arc和locator的元素,并允许各种种类的扩充连结。

3.Group和document的用法,是让群组连结到一些特别的文件。

以下我们将说明Simple的语法,有两种方法可以知道一个连结是否是Xlink:

1.直接使用simple字眼;

2.以xlink:type表示。

让我们来看看下面Simple的例子:

1.以HTML的写法如下:

2.以Xlink的写法:

  同样一个连结,另一种Xlink也可以写成:

  xmlns:xlink属性是一个名称 域(Namespaces)宣告的例子,而所谓的名称 域,是方便使用者同时使用数个文件型别宣告(Document TypeDeclaration)之机制,至於这样的做法,我们相信在未来之HTML版本中,也会朝这一方向努力。

  也许我们觉得很奇怪,为什么这些arcs会接在一起,而形成extendedlink呢?有些人可能比较喜欢(图二)的写法,因为这种连结并没有“from”和“to”,只有href的地址。

  在locator的定义中包含两个原性:href和role。href属性包含URL,role属性则包含了如何去使用连结的关键字。

  Xlink扩展了URIs的使用,其中actuate和show对於Xlink来说是非常重要的属性,原因如下:

  1.actuate的属性可以说明Link是自动地或人工地(user-command)追踪。

  2.show的属性说明另一端的连结是 要显示一个新(new)的视窗,或是取代(replace)成目前的视窗,或是 要剖析的(若该连结连结到XML文件)。

抱歉!评论已关闭.