简单的入门,在命令行下跑了下Hadoop自带的Helloworld,word count。
具体步骤参考下面的Reference,在这里只是总结下几个关键步骤:
(1) 随便把某个测试文件拷贝到HDFS上去。一般利用命令: hadoop dfs - put [arg0] [arg1],或者hadoop dfs -copyFromLocal [arg0] [arg1]
(2)向hadoop提交作业(程序),利用命令 hadoop jar [arg0] [arg1] [arg2] [arg3]
(3)运行成功后,通过命令hadoop fs -ls 和hadoop fs -cat [arg0]来观测结果。
(4)当Hadoop结束时,可以通过bin/stop-all.sh脚本来关闭Hadoop的守护进程。
Reference:
(1)http://www.linuxidc.com/Linux/2012-02/54529.htm
(2)http://blog.csdn.net/hitwengqi/article/details/8008203