现在的位置: 首页 > 综合 > 正文

Hadoop中运行WordCount

2014年09月05日 ⁄ 综合 ⁄ 共 608字 ⁄ 字号 评论关闭

第一次使用Hadoop,一般是用WordCount来作为第一个开发实例,就好像第一次写Java代码,一般是写HelloWorld一样。

那么WordCount有两种运行模式,一种是直接使用命令行运行,如下:

hadoop  jar   ./hadoop-examples-***.jar  wordcount  input  output

那么,我们在实际开发中一般是要在eclipse中开发,所以,基于eclipse的hadoop开发,还是要能熟练的使用,步骤如下:

1、在eclipse中创建一个MapReduce Project

2、创建一个class,实现WordCount功能,可以直接从Hadoop源代码中拷贝,路径:src/examples/org/apache/hadoop/examples目录下的WordCount.java

3、在WordCount类中右键单击,选择 Run As —— Run Configurations...

在弹出的对话框中,选择Arguments,在Program arguments中输入hadoop的输入和输出目录

输入目录:hdfs://IP或主机名:9000/input

目录:hdfs://IP或主机名:9000/output

4、在WordCount类中右键单击,选择 Run As —— Run on Hadoop

eclipse中即开始打印执行进度的情况,执行完毕,可通过hadoop的web服务页面查看结果

抱歉!评论已关闭.