现在的位置: 首页 > 综合 > 正文

云存储与Web2.0

2014年01月13日 ⁄ 综合 ⁄ 共 2073字 ⁄ 字号 评论关闭

在半年前写的 “我亦云云—也谈云计算(6):云服务、软件即服务和Web 2.0”(http://blog.sina.com.cn/s/blog_535dace30100buif.html)中我叙述了云服务与SaaS, Web2.0的关系。当时笔墨主要花在解释云与SaaS密切相关方面。对云与Web 2.0也“有交集”的声称只给出了简短的用例说明:“无所不在的智能手机作为Web 2.0的一个前端工具可以使许多重大事件实时上传到云上的社区网站上在第一时间传遍全球任何角落”。今天回来再补上一些更有点说服力的论据吧,主要还是为了说服自己。

要说云服务与Web 2.0有交集,在此文中我想局限在云存储方面来讲。先来看一个IDC几年前发表的预测[1]:从2006年到2010年,全球的数据量将增长6倍。到2010年时,大约70%的数据是由个人(individual, 即单个人体)产生的,而且这些数据中至少85%的部分将由各种组织来负责管理,主要是为数据在安全、隐私、可靠及法规遵从这几个方面进行管理(While nearly 70% of the digital universe will be generated by individuals by 2010, organizations will be responsible for the security, privacy, reliability and compliance of at least 85% of the information)。IDC继续强调:无构造的数据占有这些数据的95%以上(Over 95% of the digital universe is unstructured data)。

从IDC的报告中我们可以解读出不少内容。首先什么是“无构造的数据”?这个问题也可以用什么是“有构造的数据”来回答。看官请千万不要对我下面土得掉渣的回答太过认真了:“Web 2.0以前的数据主要是有构造的数据”。比如以前我想发表点什么东西都必须先经过权威专家审查,千辛万苦的研究成果绝大多数都是要被枪毙掉的。碰到运气好时(某个权威专家好心情时)被接受录用了一篇,则在万般庆贺之后必须马上诚惶诚恐将文章索引做成很有构造的数据录入一个数据库,否则错过了截止日期不能发表后果自负!在此示例一个学术界很常用的BibTex数据库条目:

@Book {MaoBook2003, Author="Wenbo Mao", Title="Modern Cryptography, Theory and Practice", Publisher="Prentice-Hall", Year="2003"}

我不详细解释这个数据库条目的含义,只说一句:它的构造是非常非常要紧的,所有双引号以外的字符一个都不能错,否则检索系统就一定会出错!又比如银行数据中心里的数据也大多是有构造的:您某年月日时分秒在全球哪个ATM机上取出了何币种多少钱,或许还附带上一小段您取款时的录像,这些数据都会严格按照行业标准的格式被存入银行的数据库中。

如今好,每一个Web 2.0的个人参与者都有不止一种产生、发表、传播数据的方法和工具,根本不必得到什么权威专家批准授权。为避免影响权威专家们的好心情我就不在此一一列出这些产生、发表、广为传播2.0型数据的方法和工具了。就这样说吧:专家们产生1.0型的有构造数据,而大量我们这些土老帽们产生2.0型的无构造数据。当然根据IDC的研究结果,还得烦请专家们来替土老帽们管理好这些无构造数据。

2.0型无构造数据相比之1.0型有构造数据除了在构造上有差别和在量上前者远比后者超大之外,还有一个显著差别:后端数据中心在存储、管理和处理2.0型无构造数据时不需要采用十分快速响应的高端硬件设备。原因是这类数据的产生和使用是在前端客户端设备(client devices)上发生的,其过程离不开若干人体器官的参与,量虽巨大可谓典型的人海技术,响应速度则实在无法恭维。既然在前端有人体使用瓶颈,后端数据中心当然就不应采用高端存储设备如光纤通道网络存储器(FC-SAN和FC-NAS之类)来处理2.0型无构造数据。(正相反,银行、证券交易所之类所用的数据中心则特别喜欢使用高速FC-SAN和FC-NAS,因为转帐、支付、实时交易、约期交割等等所产生的数据必须实时高速处理才能准确无误)。

至此晾出本文的中心思想:在云存储服务与Web 2.0的交集中,IP(Internet Protocol)连接的网络存储技术十分适用于支持的后端存储服务体系架构。这也是为何这几年IP-SAN(IP Storage Area Network)增长十分火爆。与FC-SAN相比,IP-SAN使用iSCSI接口在TCP/IP上进行数据块传输,带宽虽要低得多,但相配前端人体器官的处理速度绰绰有余,还能满足云服务的低成本要求。可以说云存储与Web 2.0相交处的问题解决任务历史性地落到了IP-SAN的肩膀上。

回到本文的开头处话题:我在半年前那篇博文中介绍了EMC云存储技术Atmos。在IaaS那一层的服务Atmos恰是基于IP-SAN技术之上的。

抱歉!评论已关闭.