【HBase分布式数据库】第七章 数据的导入导出 importtsv导入数据

第七章 数据的导入导出

7.1 importtsv导入数据

任务目的
掌握导入tsv数据的方法
掌握导入csv数据的方法
任务清单
任务1:导入tsv数据
任务2:导入csv数据

任务步骤

任务1:导入tsv数据

1、创建测试表

进入hbase的shell环境,创建测试命名空间ns和测试表table_tsv。

bin/hbase shell
create_namespace 'ns'
create 'ns:table_tsv','info','more'

8.1-1

8.1-1

2、查看准备的测试数据

在hbase主目录下的testdata目录下,已备好了测试数据,了解该数据。

cat testdata/tsvdata.txt

8.1-2

8.1-2

3、上传数据到HDFS

HDFS上创建目录,把测试数据上传到该目录并查看。

hadoop fs -mkdir -p /data/input
hadoop fs -put testdata/tsvdata.txt /data/input
hadoop fs -cat /data/input/tsvdata.txt

8.1-3

8.1-3

4、查看如何导入

通过如下指令查看导入的帮助说明。

hadoop jar $HBASE_HOME/lib/hbase-server-1.4.10.jar

8.1-4

8.1-4

5、继续查看

选择importtsv ,继续查看下一步。

hadoop jar $HBASE_HOME/lib/hbase-server-1.4.10.jar importtsv

8.1-5

8.1-5

6、书写语句

按照格式书写语句。Dimporttsv.columns=rowkey,列族:列名,列族:列名… 分别对应输入数据按照 \t 分割的数据。并等待MR执行完毕。

hadoop jar $HBASE_HOME/lib/hbase-server-1.4.10.jar importtsv  
-Dimporttsv.columns=HBASE_ROW_KEY,info:name,more:location,more:age 
            ns:table_tsv /data/input/tsvdata.txt

7、查看数据

重新进入shell环境,查看数据。

bin/hbase shell
scan 'ns:table_tsv'

8.1-6

8.1-6

任务2:导入csv数据

1、创建测试表

创建测试表table_csv。

create 'ns:table_csv','info','more'

8.1-7

8.1-7

2、查看准备的测试数据

cat testdata/csvdata.txt

8.1-8

8.1-8

3、上传数据到HDFS

hadoop fs -put testdata/csvdata.txt /data/input

8.1-9

8.1-9

4、导入数据

使用importtsv导入数据。此处需要添加分隔符的语法。

hadoop jar $HBASE_HOME/lib/hbase-server-1.4.10.jar importtsv 
-Dimporttsv.separator=',' 
-Dimporttsv.columns=HBASE_ROW_KEY,info:name,more:location,more:age 
            ns:table_csv /data/input/csvdata.txt

5、查看数据

进入shell环境,查看数据。

scan 'ns:table_csv'

在这里插入图片描述
8.1-10

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

不太灵光的程序员

有用的话可以请博主喝杯咖啡续命

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值