一:背景
为了方便MapReduce直接访问关系型数据库(MYSQL、Oracle等),Hadoop提供了DBInputFormat和DBOutputFormat两个类,通过DBInputFormat类把数据库表的数据读入到HDFS中,根据DBOutputFormat类把MapReduce产生的结果集导入到数据库中。
二:实现
我们以MYSQL数据库为例,先建立数据库、表以及插入数据,如下,
(1):建立数据库
create database myDB;
(2):建立数据库表
create table student(id INTEGER NOT NULL PRIMARY KEY,name VARCHAR(32) NOT NULL);
(3):插入数据
insert into student values(1,"lavimer");
(......
阅读全文