Hive内置数据类型

现在的位置: 首页 > 综合 > 正文

Hive内置数据类型

2018年02月08日 ⁄ 综合 ⁄ 共 1407字 ⁄ 字号小中大 ⁄ 评论关闭

Hive的内置数据类型可以分为两大类：

(1)、基础数据类型：

基础数据类型包括：TINYINT、SMALLINT、INT、BIGINT、BOOLEAN、FLOAT、DOUBLE、STRING、BINARY、TIMESTAMP、DECIMAL、CHAR、VARCHAR、DATE。下面的表格列出了这些基础数据类型所占的字节以及什从什么版本开始支持这些类型。

数据类型	所占字节	开始支持版本
TINYINT	1byte，-128 ~ 127
SMALLINT	2byte，-32,768 ~ 32,767
INT	4byte,-2,147,483,648 ~ 2,147,483,647
BIGINT	8byte,-9,223,372,036,854,775,808 ~ 9,223,372,036,854,775,807
BOOLEAN
FLOAT	4byte单精度
DOUBLE	8byte双精度
STRING
BINARY		从Hive0.8.0开始支持
TIMESTAMP		从Hive0.8.0开始支持
DECIMAL		从Hive0.11.0开始支持
CHAR		从Hive0.13.0开始支持
VARCHAR		从Hive0.12.0开始支持
DATE		从Hive0.12.0开始支持

(2)、复杂数据类型：

复杂类型包括：ARRAY、MAP、STRUCT、UNION，这些复杂类型是由基础类型组成的。

　　ARRAY：ARRAY类型是由一系列相同数据类型的元素组成，这些元素可以通过下标来访问。比如有一个ARRAY类型的变量fruits，它是由['apple','orange','mango']组成，那么我们可以通过fruits[1]来访问元素orange，因为ARRAY类型的下标是从0开始的；
　　MAP：MAP包含key->value键值对，可以通过key来访问元素。比如”userlist”是一个map类型，其中username是key，password是value；那么我们可以通过userlist['username']来得到这个用户对应的password；
　　STRUCT：STRUCT可以包含不同数据类型的元素。这些元素可以通过”点语法”的方式来得到所需要的元素，比如user是一个STRUCT类型，那么可以通过user.address得到这个用户的地址。
　　UNION: UNIONTYPE，他是从Hive 0.7.0开始支持的。

示例：

创建一张员工表：姓名name为STRING类型；薪资salary为FLOAT类型；下属subordinates为ARRAY类型，其中的元素为STRING类型；工资扣除项deductions为MAP类型，扣除项名称作为key为STRING类型，扣除费用作为value为FLOAT类型；地址address为STRUCT类型包含street为STRING类型，city为STRING类型，num为INT类型。

建表语句如下：

create table if not exists employees(
        name STRING,
        salary FLOAT,
        subordinates ARRAY<STRING>,
        deductions MAP<STRING,FLOAT>,
        address STRUCT<street:STRING,city:STRING,num:INT>
);

注：上述语句中，当字段前面用制表符填充时会报错。使用空格填充则没什么问题！

【上篇】Hive文件存储格式
【下篇】FAILED: Error in metadata: javax.jdo.JDOFatalInternalException: Unexpected exception caught.

作者: timescale

该日志由 timescale 于6年前发表在综合分类下，最后更新于 2018年02月08日.
转载请注明: Hive内置数据类型 | 学步园 +复制链接

抱歉!评论已关闭.

学步园

Hive内置数据类型

作者: timescale

书签

最新文章New

本站推荐

返回首页