Hive分享教程1-Hive简介

iteye_1344

于 2012-07-03 11:46:15 发布

阅读量135

点赞数

分类专栏： Hive分享文章标签：大数据

本文链接：https://blog.csdn.net/iteye_1344/article/details/82364303

版权

Hive分享专栏收录该内容

33 篇文章

订阅专栏

HIVE是一个SQL解释引擎，它将SQL语句转译成M/R JOB，然后在Hadoop执行，来达到快速开发的目的。Hive的表其实就是一个Hadoop的目录/文件（HIVE默认表存放路径一般是工作目录的Hive目录里面），按表名做文件夹分开，如果有分区表，分区值都是子文件夹，可以直接在其他的M/R JOB里面直接应用这部分数据。

Hive的特点有一下几点：
1.为超大数据集设计的计算/拓展能力-based on Hadoop
2.支持SQL like查询语言
3.统一的元数据管理
Hive与SQL类似，使用的语句区别不大，如：


    select word,count(*) from(select expolde(split(sentence,' '))) word from article) t group by word;

Hive的数据类型有以下分类：
原始类型：int/bigint/smallint/tinyint/boolean/double/float/string
数组类型：Array
映射：Map
结构：Struct
备注：原始类型长度跟平常的大小无异，其中HiveQL没有date/datetime类型

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。

余额充值