zmd-zk-CSDN博客

原创报错：No module named ‘pygeohash‘

bug

2024-12-28 20:44:46 274

Hash不是线程安全的，若想要线程安全就需要使用Vectory或者使用Collections工具类提供的内容，解决线程安全问题 Map --> Map<String,String> map = new ConcurrentHashMap();长度大小：byte（1字节8位）,short（2字节）,char（2字节）—> int（4字节）—> float（4字节）—> long（8字节）—> double（8字节） boolean只表示逻辑值（true，false）2、实现Runnable接口。

2024-12-26 13:08:59 268

原创 hive的存储格式

hive5种存储格式的区别

2024-12-23 08:34:03 657

原创数据库中decimal、float 和 double区别

总的来说，decimal 适用于需要高精度计算的场景，而 float 和 double 适用于一般的科学计算和工程计算。在需要精确表示小数的场景下，应当优先选择 decimal 类型。在计算机科学中，decimal、float 和 double 是用于表示和处理数值的不同数据类型。

2024-12-16 21:44:16 538

原创 Filesystem Close

一个bug

2024-12-15 22:28:23 201

原创如何使用datagrip连接spark

如何使用datagrip连接spark，并且可以使用hive中的表

2024-12-15 22:19:21 484

原创 spark如何自定义函数

spark如何自定义函数

2024-12-14 23:40:29 528

原创 spark将数据输出到hive或mysql中

使用sparkSql将输入输出到mysql或者hive中

2024-12-14 23:36:47 544 1

原创 spark读取hive和mysql的数据

spark读取mysql和hive中的数据

2024-12-13 18:58:12 882

原创 spark读取普通文件

spark读取普通文件

2024-12-13 18:54:55 401

原创 sparkSql——wordcount案例

sparkSql——wordcount

2024-12-13 18:51:31 551

原创 shuffle——spark

spark的shuffle过程

2024-12-12 21:57:31 502

原创宽窄依赖/宽窄巷子——spark

宽窄依赖/宽窄巷子

2024-12-12 21:52:44 621

原创 spark的共享变量

spark共享变量

2024-12-12 21:48:59 471 1

原创 spark的容错机制

spark的持久化机制

2024-12-10 16:51:33 719

原创 kv类型算子使用

kv类型的算子使用

2024-12-10 16:47:27 281

原创 RDD触发算子的使用

spark中的一些触发算子

2024-12-08 23:16:16 319

原创如何创建一个dws层的设备连续登录表

如何创建一个设备连续登录区间表

2024-12-08 23:09:28 340

原创 RDD转换算子的使用

spark的转换算子

2024-12-07 09:04:37 306

原创 RDD对象

RDD的概述

2024-12-07 09:00:43 180

原创使用pyspark完成wordcount案例

pyspark的案例wordcount

2024-12-06 20:42:11 292

原创 spark-submit命令总览

在集群上pyspark和spark-submit命令的使用

2024-12-06 20:38:59 558

原创阿里云中Flink提交作业

阿里云提交flink作业

2024-12-05 23:06:47 399

原创 flinkSql中累计窗口CUMULATE

flinkSql中累积窗口的使用和一个topN案例

2024-12-05 23:03:02 511

原创在服务器上实现本地python文件的依赖

使用import 在服务器上导入自己写的py文件

2024-12-04 22:39:10 458

原创 flinkSql中滑动窗口的实现

flink中滑动窗口的使用

2024-12-04 22:17:46 358

原创 flinksql的滚动窗口实现

flink滚动窗口的实现

2024-12-04 22:15:39 498

原创通过flinkSql将kafka和mysql连接

使用flinkSql快速创建mysql和kafka的连接

2024-12-03 23:25:58 697

原创 flinkSql 将流和表的互相转换

表和流的相互转换

2024-12-03 23:22:51 812

原创 flink学习（14）—— 双流join

双流join

2024-12-02 11:34:55 689

原创 flink学习（13）—— 重试机制和维表join

重试机制和维表join

2024-12-02 09:49:35 679

原创 flink学习（12）——checkPoint

checkpoint

2024-11-28 22:19:00 610

原创 flink学习（11）——state

state

2024-11-28 22:16:29 1026

原创 flink学习（10）——allowedLateness/测道输出

allowed和sideOutput的使用

2024-11-27 18:46:39 703

原创 flink学习（9）——time+water mark

watermark的使用

2024-11-27 18:44:05 911

原创 flink学习（8）——窗口函数

指在窗口触发的时候才会对窗口内的所有数据进行一次计算（等窗口的数据到齐，才开始进行聚合计算，可实现对窗口内的数据进行排序等需求）使用方式二：在分流的时候使用，可以通过context.output方法对每个数据添加一个标签。例如：要计算数字之和，进去一个12 计算结果为20，再进入一个7 ——结果为27。全量聚合函数比较简单，但是会将所有的数据存放在内存中，因此会占用大量的内存空间。使用方式一：在connect合流之后对两个类型不同的流进行处理。

2024-11-26 21:58:36 640

原创 flink学习（7）——window

窗口的使用

2024-11-26 21:55:00 835

原创 kafka生产者和消费者命令的使用

kafka-console-consumer.sh和kafka-console-producer.sh命令的使用

2024-11-25 19:24:43 678

sql练习一hive数据库数据

空空如也