自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(22)
  • 收藏
  • 关注

原创 JVM HDFS&YARN WEB URL

RMGet_RM_URL : http://RM:8088/ws/v1/cluster/info && http://RM:8088/ws/v1/clusterNMGet_ONE_NM_URL : http://RM:8088/ws/v1/cluster/nodes/NM:8041Get_ALL_NM_URL : http://RM:8088/ws/v1/cluster/nodesNNhttp://NN:50070/jmxhttp://NN:50070/jmx?ge..

2022-02-10 16:47:10 806

原创 Kerberos使用

/usr/bin/ftp 文件传输协议程序 /usr/bin/kdestroy 销毁 Kerberos 票证 /usr/bin/kinit 获取并缓存 Kerberos 票证授予票证 /usr/bin/klist 显示当前的 Kerberos 票证 /usr/bin/kpasswd 更改 Kerberos 口令...

2021-07-21 18:12:36 351 2

原创 离线ntp时间同步安装部署

注:本部署安装不适用于非红帽系统部署内网ntp服务是将一个节点时间为参考时间,将其定为master,其余节点为client;手动修改master节点时间为现实时间,client编写crontab定时任务自动同步master节点时间,进而保持集群时间的一致性。下载包snv://172.16.1.2/Repo1/MobileBox/Docs/内网ntp安装.zip解压文件建议在window下解压文件,再上传ntp文件包,下图为SVN文件解压后的内容:上传解压3.1上传上传文..

2021-06-17 09:45:22 1117

原创 nvidia&&nvidia-docker自动化部署

一、基础环境部署1.下载docker&&nvidia百度2.环境介绍:第一套环境:Debian GNU/Linux 8.2、docker18.06.2、Kubernetes v1.16.10-BCS.patch.v1、NVIDIA 440.33.01、4.9.0-0.bpo.7-amd64第二套环境:Debian GNU/Linux 9.6、docker18.06.3、Kubernetes v1.16.10-BCS.patch.v1、NVIDIA 440.33.01、4.

2021-01-21 17:02:16 607

原创 检测服务器物理机CPU是否满足超频

#!/bin/bash#dpkg -l | grep -w bc >/dev/null 2>&1 || echo -e "\033[31m install bc \033[0m" && sudo apt-get install bc >/dev/null 2>&1ModelNameMHz=`cat /proc/cpuinfo | grep "model name" | awk '{print $10}'| sed 's/GHz//' | head.

2020-09-25 19:28:23 956

原创 zookeeper自动化部署(结合ansible、pycharm)

zookeeper自动化部署

2020-09-21 18:57:23 305

原创 docker on yarn

docker on yarn

2020-03-11 14:23:50 548

原创 spark on yarn多版本共存问题解决方案

spark on yarn

2020-03-10 14:18:25 1353 5

原创 Yarn运行大致流程

2020-03-10 13:35:06 151

原创 大数据运维 fstab磁盘自动挂载脚本

#!/bin/bash#HAdoop函数function hadoop(){ echo "${needmountdisk[0]}磁盘挂载检查" #获取挂载文件夹前一个文件夹 file=${needmountfile[i]} filenum=`echo ${file#*e}` BeforeMountfilenum=`printf "%02d" $((10#...

2020-03-10 13:23:38 642

原创 进程守护工具supervisor的使用部署

supervisor使用:-c/--configuration -- configuration file path (default /etc/supervisord.conf)指定使用的配置文件:supervisord -c /etc/supervisord.conf-h/--help -- print usage message and exit-i/--interactiv...

2019-11-07 14:08:58 207

原创 kafka2.1集群部署

jdk部署 下载安装包:wgetwget --no-check-certificate --no-cookies --header "Cookie: oraclelicense=accept-securebackup-cookie" http://download.oracle.com/otn-pub/java/jdk/8u121-b13/e9e7ea248e2c4826b92b3f0...

2019-10-28 12:49:35 408

原创 大数据集群磁盘离线挂载

一、离线磁盘 1.删除hdfs配置文件磁盘的信息 vim /etc/hadoop/hdfs-site.xml 进入编辑模式,删除磁盘信息并保存退出 2.重启服务检查文件 su hdfs hdfs dfsadmin -r...

2019-07-05 10:55:01 546

原创 大数据部分组建相关命令

1、Hadoop集群(1)启动方式切换到主节点的hadoop安装目录下的sbin目录下    a)/start-dfs.sh    ./start-yarn.sh (建议使用)    b)./start-all.sh(2)关闭方式    a)./stop-dfs.sh        ./stop-yarn.sh (建议使用)    b)./stop-all.sh2、Spark集...

2018-10-10 10:55:13 181

原创 Hadoop shuffer 和 Spark shuffer区别

 Hadoop shuffer阶段分为mapshuffer阶段,reduceshuffer阶段两个阶段在理解之前需要知道shuffer是什么意思,mapreduce的任务流程,大家可以先理解一下再进一步学习下一阶段,图1、2是我在网上找了两个画的不错的mapreduce任务流程图帮助你们理解。mapshuffer阶段:   这个阶段发生在map阶段之后(数据写入内存之前),数据在写入内...

2018-09-29 11:55:38 3765

原创 大数据项目大致流程

1、提出需求-需要和多个部门负责人进行协商:关于项目的可行性分析2、需求分析-进行需求调研(研究竞品)、市场调研,如果是给甲方做产品,需要和甲方协商需求细则3、技术选型-需要多个开发部门的人员参与协商    考虑的角度:数据的生成、数据采集、源数据的存储、数据清洗、消息中间件、数据分析引擎、结果数据的存储、数据的展示4、可行性分析-预研工作:搭建技术平台,测试可行性5、指标分析-需求和指...

2018-09-29 11:25:07 10300 1

原创 kafka使用笔记

1、Segment的概念?一个分区被分成相同大小数据条数不相等的segment,每个segment由多个index文件和数据文件(.log)组成2、数据的存储机制?首先是Broker接收到数据后,将数据放到操作系统(linux)的缓存里(pagecache),pagecache会尽可能多的使用空闲内存,使用sendfile技术尽可能多的减少操作系统和应用程序之间进行重复缓存,写入数...

2018-09-29 11:18:45 174

原创 kafka常见命令

启动Kafka:/export/servers/zookeeper/bin/zkServer.sh startnohup /home/hadoop/develop_env/kafka/bin/kafka-server-start.sh /home/hadoop/develop_env/kafka/config/server.properties &查看当前服务器中的所有topicb...

2018-09-29 11:16:02 195

原创 kafka常见问题如果想消费已经被消费过的数据

1、consumer是底层采用的是一个阻塞队列,只要一有producer生产数据,那consumer就会将数据消费。当然这里会产生一个很严重的问题,如果你重启一消费者程序,那你连一条数据都抓不到,但是log文件中明明可以看到所有数据都好好的存在。换句话说,一旦你消费过这些数据,那你就无法再次用同一个groupid消费同一组数据了。原因:消费者消费了数据并不从队列中移除,只是记录了offse...

2018-09-29 11:11:49 15550 1

原创 IDEA快捷键使用

Ctrl+Alt+t 选择代码块 try catchAlt+回车 导入包,自动修正Ctrl+N   查找类Ctrl+Shift+N 查找文件Ctrl+Alt+L  格式化代码Ctrl+Alt+O 优化导入的类和包Alt+Insert 生成代码(如get,set方法,构造函数等) mac系统 fn+alt+回车Ctrl+E或者Alt+Shift+C  最近更改的代码Ctrl+R 替...

2018-09-29 11:05:51 194

原创 oozie错误

1、Cannot run program "en.sh" (in directory "/home/install/hadoop-2.5.0-cdh5.3.6/tmp/nm-local-dir/usercache/hadoop/appcache/application_1523583797725_0010/container_1523583797725_0010_01_000002"):erro...

2018-09-29 11:03:03 1540

原创 mapreduce调优

一、调优的目的    充分的利用机器的性能,更快的完成mr程序的计算任务。甚至是在有限的机器条件下,能够支持运行足够多的mr程序。二、调优的总体概述    从mr程序的内部运行机制,我们可以了解到一个mr程序由mapper和reducer两个阶段组成,其中mapper阶段包括数据的读取、map处理以及写出操作(排序和合并/sort&merge),    而reducer阶段包含map...

2018-08-02 16:52:29 255

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除