现在的位置: 首页 > 综合 > 正文

hive学习 hive中的数据类型

2019年05月24日 ⁄ 综合 ⁄ 共 1180字 ⁄ 字号 评论关闭

(1)基本类型

数据类型 所占字节 开始支持版本
TINYINT 1byte,-128 ~ 127
SMALLINT 2byte,-32,768 ~ 32,767
INT 4byte,-2,147,483,648 ~ 2,147,483,647
BIGINT 8byte,-9,223,372,036,854,775,808 ~ 9,223,372,036,854,775,807
BOOLEAN

FLOAT 4byte单精度
DOUBLE 8byte双精度
STRING

BINARY
从Hive0.8.0开始支持
TIMESTAMP
从Hive0.8.0开始支持

(2)混合类型:

Array


ARRAY
类型是由一系列相同数据类型的元素组成,这些元素可以通过下标来访问。比如有一个ARRAY类型的变量fruits,它是由['apple','orange','mango']组成,那么我们可以通过fruits[1]来访问元素orange,因为ARRAY类型的下标是从0开始的;

Array(“test1”,”test2”)

Map

MAP包含key->value键值对,可以通过key来访问元素。比如”userlist”是一个map类型,其中usernamekeypasswordvalue;那么我们可以通过userlist['username']来得到这个用户对应的password

map(“username”,”zhu”)

Struct

STRUCT可以包含不同数据类型的元素。这些元素可以通过”点语法”的方式来得到所需要的元素,比如user是一个STRUCT类型,那么可以通过user.address得到这个用户的地址。

struct(“zhu”,”2428922)


例子:

    CREATE TABLE employees (  
        name STRING,  
        salary FLOAT,  
        subordinates ARRAY<STRING>,  
        deductions MAP<STRING, FLOAT>,  
        address STRUCT<street:STRING, city:STRING, state:STRING, zip:INT>  
    ) PARTITIONED BY (country STRING, state STRING);  

表已经建立完成,现在说说hive的数据文本编码:

指定分割标记:

    CREATE TABLE employees (  
        name STRING,  
        salary FLOAT,  
        subordinates ARRAY<STRING>,  
        deductions MAP<STRING, FLOAT>,  
        address STRUCT<street:STRING, city:STRING, state:STRING, zip:INT>  
    ) PARTITIONED BY (country STRING, state STRING);  
    row   formate delimited
    fields terminated by ',';

抱歉!评论已关闭.