自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 对文件夹中所有的文件批量替换其内容

bin/bash # 检查参数是否正确 if [ "$#" -ne 3 ];do # 备份文件(可选) cp "$file" "$file.bak" # 使用 sed 替换内容 sed -i "s/$OLD_VALUE/$NEW_VALUE/g" "$file" # 输出处理信息 echo "Processed: $file" done echo "All replacements completed."

2025-02-18 16:04:22 157

原创 pycharm 上运行 pyspark demo

创建 SparkConf 对象并设置应用名称和主节点。# 使用 reduce 方法计算 RDD 中所有元素的和。# 创建 SparkContext 对象。# 停止 SparkContext。# 将列表转换为 RDD。

2024-11-26 14:04:02 189 1

原创 datax集成clickhouse需要的jar包

reader 和writer需要的插件。datax集成 clickhouse。

2024-08-12 16:14:14 165

原创 dolphinscheduler(2.0.5)通过自定义 shell script实现告警通知

**${warnLevel}**>**已运行时长**:**${runTime}**">**告警事件**:**${event}**title="工作流执行预警

2024-08-12 10:22:16 1967 2

原创 dolphinscheduler(2.0.5)集成CDH安装的sqoop

a. 可以选择直接修改DS配置文件中的环境变量(所有安装了ds的机器都要修改) /opt/module/dolphinscheduler/conf/env。1. 将 mysql-connector-java-8.0.27.jar 包导入至 dolphinscheduler的lib目录下,并分发至安装了DS的所有机器。(3) 确保每台安装了dolphinscheduler的机器上安装了sqoop。b. DS的管理页面创建一个新的环境变量。

2024-08-11 14:57:23 896

原创 DBeaver提示Method not supported

DBeaver提示Method not supported

2024-08-11 09:14:36 344

原创 CDH搭建大数据集群过程中的问题记录

之前初始化 namenode 在 /dfs/nn 留下了残留数据,从而影响再次初始化。手动格式化namenode,查看日志:hdfs namenode -format。删除agent目录下面的cm_guid文件,并重启失败节点的agent服务恢复。2. 主机名不要有 _ 等特殊字符, 否则CDH启动 agent会报错。清空残留数据后,重新初始化。

2024-08-09 14:58:02 304

原创 HUE页面点击“管理用户“ 报500异常

HUE页面点击"管理用户" 报500异常

2024-08-09 14:39:33 378

原创 hive 中 translate 替换

hive中 translate在替换字符串的时候会将替换的字符串拆成一个个的字符去替换。例: select translate('aaabbbcccddd','bc','')输出: aaaddd。

2024-08-08 14:45:09 332

原创 Dolphinscheduler 集成DATAX

datax默认环境变量存配置位置/opt/module/dolphinscheduler/conf/env/dolphinscheduler_env.sh。usr/java/jdk1.8.0_181-cloudera 为环境安装的位置 通过 which java 或者 echo $JAVA_HOME 查看。1. 环境配置: 按照自己服务器中相关环境安装的位置配置相应的环境变量.如果不配置,会使用datax默认的环境变量.2. 修改环境变量以后执行调度任务。执行下面命令,添加软连接.

2024-08-07 13:09:42 1405

原创 hive 从 textfile格式的表中写入数据到orc格式的表中报错 ​​​​

错误信息: Caused by: java.lang.ClassCastException: org.apache.hadoop.io.Text cannot be cast to org.apache.hadoop.hive.ql.io.orc.OrcSerde$OrcSerdeRow。

2024-08-06 14:32:48 406

原创 Hive建表以后comment中的中文注释为???

查看 comment 字段是否为 utf8, 如果不是utf8使用以下命令修改字段的编码,修改以后重启mysql.由于是通过CDH安装的hive 所以直接在页面配置中修改属性 javax.jdo.option.ConnectionURL。问题: 搭建hive以后在建表的时候发现 hive表中的中文注释为?解决: 1 查看元数据中的表的编码。修改完成后,重启hive。

2024-08-06 14:22:18 642

转载 hive远程访问密码设置

123456

2024-08-05 16:11:15 152

datax依赖的clickhouse包

datax依赖的clickhouse包

2024-08-12

hive-common-2.1.1-cdh6.3.2.jarjava-json.jarmysql-connector-jav

DS集成sqoop用到的jar包

2024-08-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除