现在的位置: 首页 > 综合 > 正文

hive external table partition 关联HDFS数据

2013年11月26日 ⁄ 综合 ⁄ 共 979字 ⁄ 字号 评论关闭

EXTERNAL 外部表 在建表的时候制定一个指向实际数据的路径(LOCATION)
hive创建内部表时,会将数据移动到数据仓库指向的路径;
          创建外部表时,仅记录数据所在的路径,不对数据的位置做任何改变,
在删除表的时候:
    内部表的元数据和数据会被一起删除,

    而外部表只删除元数据,不删除数据。

HDFS中已经导入了城市日期数据文件。

/user/songwei/cityFile/visitDate=2011-10-23

/user/songwei/cityFile/visitDate=2011-10-24

创建外部表:

create external table test1(ip STRING,city STRING) partitioned by(visitDate STRING)
row format delimited fields terminated by '\t' STORED AS TEXTFILE location '/user/songwei/cityFile'

在hive中执行:

select count(*) from test1 ;

没有任何返回结果。

这是因为hive并不会自动关联hdfs中指定目录的partitions目录。

需要通过:

alter table test1 add partition (visitDate=2011-10-23);进行分区与分区数据的关联。

此时可以通过查找hive对应的db的meta数据进行查看。

查找test1表:

select * from TBLS where TBL_NAME='test1'

找出表ID

查找该表对应的分区信息:

select * from PARTITIONS where tbl_id=1;

能够查到通过alter table test1 add partitions(visitDate=2011-10-23)添加的分区信息。

英文标签:query external table with partitions not return any data

可以通过如下语句转换外部表和内部表

alter table tablePartition set TBLPROPERTIES ('EXTERNAL'='TRUE');  //内部表转外部表
alter table tablePartition set TBLPROPERTIES ('EXTERNAL'='FALSE');  //外部表转内部表

抱歉!评论已关闭.