现在的位置: 首页 > 综合 > 正文

手持设备访问互联网策略综述

2013年10月30日 ⁄ 综合 ⁄ 共 5858字 ⁄ 字号 评论关闭
    对于手持设备访问Web网络,目前存在多种不同的策略,这些策略从整体上可以划分为两种:内容处理策略和访问模式策略。内容处理策略可以细分为内容定制和内容转换,前者通过为现有的Web页面生成新版本的页面从而适合手持终端访问,而内容转换则通过转换既有的Web页面,使之适合于手持设备访问;而访问模式策略可以细分为客户端处理模式和服务器端处理模式。客户端处理模式主要致力于通过类似于PC的浏览器策略实现访问,而服务器访问模式则。。。这两大类四种策略不是毫不相关的,事实上,它们存在交互,它们之间的关系可以用下图进行描述归类:

从上图中可以看出,四种策略相互交叉,内容定制和内容转换既可以用于客户端,也可以用于服务器端;反之,客户端和服务器端分别既可以使用内容定制,也可以使用内容转换。
2.1内容处理策略
2.1.1 内容定制
    内容定制是最简单的一种访问策略。由于HTML规范的相对复杂,因此产业界和学术界针对手持设备的特点制定了专门的描述规范。这些规范或者是HTML规范的裁减,比如cHTML;或者是一个完全新的规范,比如WML。根据这些新规范为既有的Web页面重新生成新的页面我们称之为内容定制。比如目前中国移动的手机门户,wap.qq.com等都属于内容定制。
目前存在的用于无线访问的协议规范可以分为三种:WML,cHTML和HDML。
2.1.2 WML(Wireless Markup Languale)
    1997年爱立信、摩托罗拉、诺基亚以及Unwired Planet四家公司发起了WAP论坛,并针对手持设备的特点制定了WML(无线标记语言)规范,所有的使用WML编写的Web网页都可以通过手持设备访问。
2.1.3 i-node的cHTML(Compact HTML)
    除了WML之外,日本Access公司推出了针对移动设备的cHTML(Compact HTML)规范,并于1998年成为W3C的标准。cHTML是HTML 2.0、HTML 3.2和HTML 4.0的子集,是设计给小信息量的设备使用的。由于cHTML是HTML 4.0的子集,所以cHTML 不支持HTML 4.0所用的一些网页特征。
     cHTML在有限存储(如:28-512Kb RAM和512K-1Mb ROM)和低功耗CPU(如:1-10 MIPS类CPU)上实现。支持网络内容在单色小屏幕(如:50x30点阵,100x72点阵或150x100点阵)上阅读。cHTML网页的URL允许的最大长度是100bytes。i-Mode支持黑白2bit GIF文件,另外,只有GIF87、87a及89a可用,而GIF图形最大尺寸是94x72点阵。cHTML网页的最大允许尺寸不许超过5KB,但是对于使用的标记不同,有的网页即使少于5KB,也不能正常显示,每页最好少于2KB
cHTML与HTML非常类似,但是也存在差异,因此如果现有设备通过cHTML规范访问HTML页面,现有的HTML页面也必须做出一定的修改和调整。
2.1.4 HDML(Handheld Devices Markup Language)
    另外1997年5月,World Wide Web Consortium(W3C:万维网协会)成员Unwired Planet(现在的Phone.com),向W3C提交了HDML (Handheld Device Markup Language) 规范用语支持移动设备访问互联网。尽管W3C当时对Unwired Planet的提交予以批准,但当时的HDML却一直被认为是草案,并且至今一直没有改进过,因此很少使用。
2.1.2 内容定制存在的问题
    尽管内容定制更容易实现,但是它所存在的问题主要在于工作量太大。为了能够让各种手持设备访问目前的web页面,那么每个页面至少需要使用每个规范重写一次;事实上这几乎是不可能的。另外一个问题就是内容定制缺乏足够的灵活性。不同的终端具有不同的屏幕大小,如果需要取的最佳的浏览效果,最好能够根据每个终端的情况进行调整,甚至进行重新编写。而这几乎是很难实现的。
内容定制存在的另外一个问题就是访问的不兼容,PC机无法访问这些定制的Web页面,反之手持设备无法访问HTML页面。因此目前而已
2.1.2内容转换
    尽管内容定制可以解决一部分手持设备访问互联网的问题,但是它仍然存在难以克服的问题。因此目前研究最多发展最快的就是内容转换,内容转换可以分为半手工以及完全自动转换。
对于半手工转换,黄俊龙,罗济群在[2]中给出了一个基于前置处理标志语言PML的处理策略。在该策略中,用户将页面中需要转换的内容使用PML标签进行标记。由于PML标签通常以注释的形式存在于HTML页面中,因此并不影响整个HTML本身。转换程序通过读取HTML中的PML标签,并将其裁减出来发送给手持设备。…….与[2]将标记保存在HTML内部不同,在[3]中,Chieko Asakawa等人通过外部的标记文件实现对对所需内容的裁剪。这种思想一直在IBM的WTP(Wireless Transcoding Publisher)中,[4]。
    在半手工转换中,尽管内容的转换不管是从HTML到WML还是从HTML到cHTML都可以通过定义转换XSLT自动完全,但是对于选择转换的内容则通常需要人为介入,或者手工或者通过添加内部或者外部标记实现内容裁剪。这种半手工处理策略通常只适用于Web页面较少,用户可以进行修改的情况,因此它更适合于转换企业内部Web页面。而对于外部页面由于无法进行预处理,因此这种策略就不适用。不过真是由于这种策略有了人为的介入,使得它的可靠性非常之高,因此在很多可靠性和准确度比较高的场合,比如用户信息定制等方面使用比较广泛。目前IBM的Websphere的WTP和Weblogic的mobileware都属于这种半手工转换。
    与手工相比,全自动的页面转换过程不需要任何的人为的介入,它能够自动裁剪Web页面并进行有效转换,从而发送到手持设备。自动转换的过程既可能是发生在客户端的浏览器中,也可能是发生在浏览器与Web服务器之间的代理服务器中。通常情况下,客户端发出请求至代理服务器,代理服务器获取原始Web页面并根据客户端手持设备性能进行转换处理,同时将处理结果返回给手持设备。
内容定制和内容转换可以用下图进行描述:
    左侧描述的是内容转换示意图,而右侧描述的则是自动转换的示意图。蓝色部分标明了它们分别的工作量。从上图中可以看出,内容转换的工作量在于为需要描述的信息进行各种版本的定制,如果需要取得良好的效果,每种格式针对不同的手持设备类型又要分别进行多次调整。因此工作量非常庞大。而对于内容转换而言主要的工作量在于生成原始的HTML页面,或者可能还需要添加裁剪标记。两者相比可以看出内容转换的优势所在。不过与内容定制相比,内容转换的准确度和可靠性要差一些。
2.2 访问处理策略
2.2.1客户端处理策略
    客户端处理策略通常是指直接通过手持设备内的浏览器直接访问HTML格式的Web页面,并直接在浏览器上进行布局显示,这种工作方式与普通的PC访问互联网大致相同。对于这种访问方式,不同的浏览器厂商有不同的处理策略,目前可以细分为四种:完全处理策略,缩略图处理策略,主题式处理策略以及智能布局处理策略。
2.2.1.1 完全处理策略
    完全处理策略意味着手持设备所采取的处理策略与PC机器完全相同。这种策略通常使用在Pocket PC或者Handheld PC上。对于小的页面而言,这种策略尚能接受,但是对于比较大的页面,用户必须使用垂直和水平滚动条进行滚动才能浏览整个页面。对于手持设备,过分依赖水平滚动条并不是一个明智的做法。目前这种策略在微软的Pocket PC中的IE精简版本中使用得非常广泛但是满意度也最差。该策略处理效果如下图所示:

2.1.2 缩略图处理策略
    论文[5][6]中给出了一种基于缩略图的Web浏览策略。论文中将给定的Web页面根据VIPS算法进行分块,并将分块后的页面生成缩略图合并组成新的Web页面返回给手持设备。对于用户而言,访问特定的页面通常必须经过两级访问,首先找到与之对应的缩略图,然后浏览器将该缩略图还原为对应的HTML页面。通常情况下,还原后的页面足够小,以致在浏览器中显示不成问题。与访问对应,用户从一个子页面返回到另外一个子页面最少必须经过三个访问:一次回退,二次访问。显然这将大大的影响用户的使用体验。作为对缩略图思想的进一步扩展,[7]中除了上面的二级浏览策略外还提出了一种放大镜访问策略,对于生成的页面,当鼠标移动到指定区域的时候,直接用“Tip”的方式将其放大显示。论文[8]中允许在访问的时候对给定的缩略区域进行扩展和折叠,这样在经过几次折叠之后,用户需要浏览器的区域将变得非常清晰。
这三种策略的适用效果如下图所示:
缩略图访问策略             放大镜访问策略                      折叠/扩展访问策略
基于缩略图的访问策略最主要的问题主要包括三个方面:(1)、由于需要进行分页,页面转换为图片,图片再转换为页面,因此一方面对手持设备的性能要求较高,否则页面转换换图片是一个耗时的过程。(2)由于转换后的页面变为缩略图,因此页面变得非常不清晰,这个可以从上面的图示(图片大小与实际的手持设备屏幕大小类似)看出。因此,除非用户对页面比较熟悉,否则如果页面内容很多的情况下,用户很难一下子找到自己希望浏览的内容。
2.2.1.3 提纲式处理策略
2.2.1.4 智能布局处理策略
    对于客户端处理策略而言,代表最主要的研究方式则是智能布局处理策略。所谓智能布局处理策略就是对页面进行调整,使之大小,尺寸能够适合于手持设备屏幕。目前各家主要的浏览器厂商都推出了自己的拿手键并纷纷申请了专利。
    Opera是目前最大的手持设备浏览器厂商。目前Opera嵌入式浏览器主要使用的是SSR[9](Small Screen Render,小屏幕定位)技术。与Opera类似,日本的Access公司[10]的NetFront浏览器中采用了Rapid Render™Smart-Fit Rendering™专利。SSR和Smart-Fit Render技术通过缩小图片、字体以及删除空白等技术将网页调整为手持设备屏幕的宽度,这样就可以有效避免使用垂直滚动条。经过自动调整,整个Web页面的内容和功能都保留下来,只有布局发生了变化。下面是Opera和NetFront访问不同网站的结果:
         由于SSR和Smart-Fit Rendering都属于不公开的技术。目前这两种浏览器通常都安装与智能手机上。
2.2.1.5 文本处理策略
除了上面的四种处理策略之外,还有一种文本处理策略。
2.2.2服务器端转换
    与基于浏览器的客户端策略相比,基于服务器的解决方案是目前的另外一个研究重点。与浏览器直接与原始Web服务器打交道不同,基于服务器的转换在浏览器和原始Web服务器之间增加转换服务器。所有的请求发送给转换服务器,转换服务器抓取指定的Web页面并进行分析转换,最终发送给手持设备。
    [11][12]中设计了一个转换系统原形WebAlchemist,它通过定义四条转换推测规则,并根据推测规则尝试从HTML的语法信息比如表格宽度,字体大小以及CSS样式表中提取语义信息,并将这些语义信息进行转换。该转换系统能够在保留整体页面布局结构的情况下,对结构内的信息进行合并和重组,这样浏览者能够获取页面的大致印象。
    [13]给出了一个基于模糊规则的HTML转换策略。文中,作者设计了一种基于模糊规则的语言Fuzzy-RDL/TT,并使用该语言描述了一系列的转换函数以及Fuzzy-RDL/TT (Fuzzy Rule Description Language for Tree Transformation)specifies sets of transcoding functions and de-fines their selection with respect to user and hardware pro-files. The definition of profile selection is defined by the means of fuzzy rule descriptions where transcoding functionsare specified by a Java-oriented language which operateon the DOM (Document Object Model) tree representation of an XML-based document.
[14]中则提出了一种称之为HAN(Hierarchical Atomic Navigation,层次式原子浏览)的转换策略。转换中,对于原始的Web页面内容。Hierarchical Atomic Navigation. Unlike previous techniques, Hierarchical Atomic Navigation keeps all original information in a readable way, without imposing the use of a specific browser. To achieve this goal, a navigator page is used to represent original contents in a symbolic way. A set of representative icons replaces unreadable elements. These icons are linked to actual individual contents,as a set of atomic pages. Hierarchical Atomic Navigation can be used on any PDA, regardless of OS and browser choice, since both navigator and atomic pages use widely supported standard formats (e.g.XML, HTML).
                                                                                          (continued)

抱歉!评论已关闭.