- 博客(5)
- 资源 (19)
- 收藏
- 关注

原创 nifi 1.7.1 安全集群设置+用户创建(Kerberos 配置 )
系统环境及软件版本 CentOS7 JDK1.8.0_91 Nifi-1.7.1 Kerberos5 zookeeper3.4.5 nifi-toolkit-1.7.1 集群信息:host_name IP service server 192.0.0.230 Kerberos5 Server, Nifi ...
2018-09-04 21:11:06
1792
1
转载 Hadoop 之上的数据建模 - Data Vault 2.0
对比传统的基于 RDBMS 之上的数据仓库和商业智能项目,尝试着说说,Hadoop 之上的数据仓库,从ETL, 数据存储,到分析展现。重点围绕数据建模方面做分析,因为这是本文的重点,介绍一份新的数据建模方式 Data Vault 2.0.ETL 最基本的构建来自于 转换和工作流。工作流,作用是规划一条完整的数据转换流。转换,是 ETL 最中心的组件。可以用 MapReduce 来完成,...
2018-10-08 17:27:54
1180
原创 Linux下用rm删除的文件的恢复方法
对于rm,很多人都有惨痛的教训。我也遇到一次,一下午写的程序就被rm掉了,幸好只是一个文件,第二天很快又重新写了一遍。但是很多人可能就不像我这么幸运了。本文收集了一些在Linux下恢复rm删除的文件的方法,给大家作为参考。 首先,最好的方法是避免这个问题,以下是几点建议: 1、rm -rf误操作的后果是可怕的,rm -f也要三思而行,不能轻易使用。 2、做好数据备份。 3、...
2018-09-05 17:05:53
111110
2
原创 Oracle 分析,分组函数 group by 高级用法 grouping sets,rollup和cube区别
Oracle的GROUP BY语句除了最基本的语法外,还支持ROLLUP和CUBE语句。如果是ROLLUP(A, B, C)的话,首先会对(A、B、C)进行GROUP BY,然后对(A、B)进行GROUP BY,然后是(A)进行GROUP BY,最后对全表进行GROUP BY操作。如果是GROUP BY CUBE(A, B, C),则首先会对(A、B、C)进行GROUP BY,然后依次是(A、B)...
2018-09-05 17:01:39
1746
kafka+flume 实时采集oracle数据到hive中.docx
2020-08-11
apache-airflow-1.10.3-bin.tar.gz
2019-08-06
apache-tez-0.8.3-src.tar.gz
2019-08-06
apache-tez-0.9.0-bin.tar.gz
2019-08-06
hadoop2.2+hbase0.96+hive0.12安装整合详细高可靠文档及经验总结
2019-03-07
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人