【转】基于Azure云计算平台的网格计算，第2部分：开发网格应用

现在的位置: 首页 > 综合 > 正文

【转】基于Azure云计算平台的网格计算，第2部分：开发网格应用

2013年01月26日 ⁄ 综合 ⁄ 共 3437字 ⁄ 字号小中大 ⁄ 评论关闭

在本系列的第1部分，我们介绍了在Azure上进行网格计算的设计模型。在这篇文章中，我们将用C#来开发一个网格应用程序以实现这个模式；而在第3部分，我们将首先在本地运行这个应用程序，接着在云中运行。为了实现这些功能，我们需要网格计算框架提供的辅助功能。

网格框架的角色

除非你准备编写大量的底层基础软件，那么应该为你的网格应用程序选用一个框架，来消除繁重的工作，让你集中精力于应用程序代码的编写。虽然Azure实现了你想在网格计算基础结构中所需的很多服务，但仍然需要在Azure和网格应用程序之间添加一些特定于网格的功能。一个优良的网格计算框架应该为你完成如下工作：

提供对工作运行的计划调度和控制能力
从底层存储中检索输入数据。
为网格执行器生成任务以便执行
把任务分发到可用的执行器
在网格执行应用程序的时候跟踪任务的状态
从执行器中收集结果
把结果存储到底层存储中

下图显示了框架如何把网格应用程序和Azure平台结合到一起。应用程序开发人员只需编写应用程序特定的代码去加载输入数据、生成任务、执行任务和保存结果数据。这个框架提供了全部所需功能——这些功能极大地利用了Azure平台的特点。

part2-1

在本篇文章中，我们将利用Azure Grid，一个Neudesic Grid Computing Framework的社区版本。Azure Grid提供了4个软件组件，来实现列在下面的所有功能：

加载器，让你可以添加自己的代码，来从底层资源中提取输入数据并生成任务。
执行器角色，让你可以添加自己的代码，来执行应用程序任务。
聚合器，让你可以添加自己的代码，来把结果存储回底层资源。
网格管理器，让你启动工作运行，并监测它们的执行情况。

Azure Grid只在你的网格应用程序执行期间才使用云资源，使你的费用尽量最低。底层存储保存着输入数据、结果和Azure Grid的跟踪数据库。云存储用于与执行器通信过程的参数传递和结果收集，且在你的网格应用程序执行的时候把它们都清空。一旦你的网格应用程序执行完成，在空闲的时候，你也可以挂起网格执行器的运行实例，那么就无需为存储和计算时间支付持续的费用。

应用程序：Fraud Check

我们将要编码的应用程序是一个虚构的欺诈检查（fraud check）程序，使用某些规则对申请者数据进行计算，以求出欺诈可能性分数。每个申请者的记录都作为一个网格任务来进行处理。申请者记录具有这样的结构：

part2-2

通过在申请者记录上应用业务规则，Fraud Check程序可算出一个0到1000之间的欺诈可能性分数，而0表示最坏可能的分数。如果分数低于500，那么申请可能被拒绝。

设计网格应用程序

在你设计网格应用程序的时候，你需要确定能把工作划分到可并行执行的独立任务的最好方法。你首先要考虑2个关键问题：

你基于什么基础来划分工作为任务？
有多少种不同类型的任务？

在Fraud Check这个例子中，为每个申请者记录创建单独的任务是很有道理的：为每个记录评出欺诈分数是一个原子操作，而且在所有的记录处理完成后，它们的顺序如何也无所谓。

对于Fraud Check而言，只需要一种任务类型，我们将其命名为“FraudScore”。FraudScore任务就是为申请者记录算出欺诈分数。

这些任务需要读取输入数据，生成结果数据。FraudScore的输入数据也即申请者记录，而结果数据则是欺骗分数加上一个文本字段来解释得到这个分数的原因。FraudScore所需的参数和返回结果，连同其名称一起显示在下面。

part2-3

在某些网格计算应用程序中，任务在完成工作的时候可能也需要访问额外的资源，比如数据库或Web Services。FraudScore没有这样的需求，不过如果需要的话，可以通过输入参数来提供必需的信息，如Web Service地址和数据库连接字符串。

开发网格应用程序

现在，我们的网格应用程序的输入参数、任务和结果字段已经定义好了，我们可以继续编写应用程序了。Azure Grid只要求我们编写加载器（Loader）、应用程序任务和聚合器（Aggregator）的代码。

编写加载器代码

加载器代码负责读取输入数据，并生成附带参数的任务。大部分时候，这些数据都来自于数据库，不过Fraud Check编写成从电子数据表中读取输入数据。

Azure Grid通过一个名为AppLoader的类，为你的加载器提供了一个可以开始编码的模板。需要实现GenerateTasks方法，来获取你的输入数据，生成带有任务类型名称和参数的任务。你的代码创建Task对象，并作为数组返回。在基类中，GridLoader，把你的任务处理为队列后放到任务执行位置的云存储中。

part2-4