第一次使用Hadoop,一般是用WordCount来作为第一个开发实例,就好像第一次写Java代码,一般是写HelloWorld一样。
那么WordCount有两种运行模式,一种是直接使用命令行运行,如下:
hadoop jar ./hadoop-examples-***.jar wordcount input output
那么,我们在实际开发中一般是要在eclipse中开发,所以,基于eclipse的hadoop开发,还是要能熟练的使用,步骤如下:
1、在eclipse中创建一个MapReduce Project
2、创建一个class,实现WordCount功能,可以直接从Hadoop源代码中拷贝,路径:src/examples/org/apache/hadoop/examples目录下的WordCount.java
3、在WordCount类中右键单击,选择 Run As —— Run Configurations...
在弹出的对话框中,选择Arguments,在Program arguments中输入hadoop的输入和输出目录
输入目录:hdfs://IP或主机名:9000/input
输出目录:hdfs://IP或主机名:9000/output
4、在WordCount类中右键单击,选择 Run As —— Run on Hadoop
eclipse中即开始打印执行进度的情况,执行完毕,可通过hadoop的web服务页面查看结果