我去前面探个路-CSDN博客

原创 hive 设置队列

hive 设置队列需要根据所使用的引擎进行对应的设置才会有效果，否则无效设置引擎set hive.execution.engine=mr; set hive.execution.engine=spark; set hive.execution.engine=tez; 如果使用的是mr(原生mapreduce)SET mapreduce.job.queuename=etl;如果使用的引擎是t...

2018-07-04 11:01:02 13552 1

原创 hive自定义函数UDF

当hive自带函数很难满足或者无法满足hql时，可以自定义函数（UDF） 1、先写java类，继承UDF，并重载evaluate方法 package com.timo.bigdata.udf import org.apache.hadoop.hive.ql.exec.UDF; import org.apache.hadoop.io.Text; public final class Lower

2017-10-26 22:47:20 214

原创日志采集

关于日志采集业界比较经典的用法：线上数据→flume→kafka→hdfs→mapreduce离线计算或者线上数据→flume→kafka→storm （实时）其中后者可以应用于实时监控的短信邮件告警等。 storm也可用spark steaming（准实时，吞吐量比 storm 大）组件 flume：日志采集系统 kafka：消息中间件关于storm与

2017-10-26 17:58:10 373

转载（转）Spark Streaming与Storm的对比分析

本文转自：http://blog.csdn.net/kwu_ganymede/article/details/50296831 原作者kwu_ganymede Spark Streaming与Storm的对比分析一、Spark Streaming与Storm的对比二、Spark Streaming与Storm的优劣分析事实上，S

2017-10-26 17:43:42 294

原创 hbase常用命令

hbase常用命令创建表: create '表名', '列族名1','列族名2','列族名N' 查看所有表: list 描述表: describe ‘表名’ 判断表存在: exists '表名' 判断是否禁用启用表: is_enabled '表名' ; is_disabled ‘表名’ 添加记录 : put ‘表名’, ‘rowKey’,

2017-10-19 22:11:55 346

原创初认hadoop

什么是hadoop？ hadoop = teh hadoop projects hadoop体系架构生态圈主要包含common，avro，mapreduce，hdfs,pig,hive(数据仓库),hbase，zookeeper,oozie（任务调度），sqoop（数据转移hive ↔ mysql）等组件 hadoop核心： hdfs（分布式文件系统）+ mapreduce （计

2017-10-19 22:08:57 202

mysql-connector-java-5.1.38-bin.jar

mysql 的jdbc 驱动mysql-connector-java-5.1.38-bin.jar

2017-10-01

ubuntu linux 自带的protobuf怎么卸载或者升级版本啊

2017-09-22

TA创建的收藏夹 TA关注的收藏夹

TA关注的人