Hive分享教程1-Hive简介

HIVE是一个SQL解释引擎,它将SQL语句转译成M/R JOB,然后在Hadoop执行,来达到快速开发的目的。Hive的表其实就是一个Hadoop的目录/文件(HIVE默认表存放路径一般是工作目录的Hive目录里面),按表名做文件夹分开,如果有分区表,分区值都是子文件夹,可以直接在其他的M/R JOB里面直接应用这部分数据。

Hive的特点有一下几点:
1.为超大数据集设计的计算/拓展能力-based on Hadoop
2.支持SQL like查询语言
3.统一的元数据管理
Hive与SQL类似,使用的语句区别不大,如:

select word,count(*) from(select expolde(split(sentence,' '))) word from article) t group by word;


Hive的数据类型有以下分类:
原始类型:int/bigint/smallint/tinyint/boolean/double/float/string
数组类型:Array
映射:Map
结构:Struct
备注:原始类型长度跟平常的大小无异,其中HiveQL没有date/datetime类型
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值