自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(110)
  • 收藏
  • 关注

原创 SQL连续登录问题(详细案例分析)

sql

2024-12-28 20:51:21 540

原创 报错:No module named ‘pygeohash‘

bug

2024-12-28 20:44:46 274

原创 【快速上手】Doris的安装与部署

Doris 的安装

2024-12-28 20:39:14 1778

原创 Java高频面试题

Hash不是线程安全的,若想要线程安全就需要使用Vectory或者使用Collections工具类提供的内容,解决线程安全问题 Map --> Map<String,String> map = new ConcurrentHashMap();长度大小:byte(1字节8位),short(2字节),char(2字节)—> int(4字节)—> float(4字节)—> long(8字节)—> double(8字节) boolean只表示逻辑值(true,false)2、实现Runnable接口。

2024-12-26 13:08:59 268

原创 hive的存储格式

hive5种存储格式的区别

2024-12-23 08:34:03 657

原创 数据库中decimal、float 和 double区别

总的来说,decimal 适用于需要高精度计算的场景,而 float 和 double 适用于一般的科学计算和工程计算。在需要精确表示小数的场景下,应当优先选择 decimal 类型。在计算机科学中,decimal、float 和 double 是用于表示和处理数值的不同数据类型。

2024-12-16 21:44:16 538

原创 Filesystem Close

一个bug

2024-12-15 22:28:23 201

原创 如何使用datagrip连接spark

如何使用datagrip连接spark,并且可以使用hive中的表

2024-12-15 22:19:21 484

原创 spark如何自定义函数

spark如何自定义函数

2024-12-14 23:40:29 528

原创 spark将数据输出到hive或mysql中

使用sparkSql将输入输出到mysql或者hive中

2024-12-14 23:36:47 544 1

原创 spark读取hive和mysql的数据

spark读取mysql和hive中的数据

2024-12-13 18:58:12 882

原创 spark读取普通文件

spark读取普通文件

2024-12-13 18:54:55 401

原创 sparkSql——wordcount案例

sparkSql——wordcount

2024-12-13 18:51:31 551

原创 shuffle——spark

spark的shuffle过程

2024-12-12 21:57:31 502

原创 宽窄依赖/宽窄巷子——spark

宽窄依赖/宽窄巷子

2024-12-12 21:52:44 621

原创 spark的共享变量

spark共享变量

2024-12-12 21:48:59 471 1

原创 spark的容错机制

spark的持久化机制

2024-12-10 16:51:33 719

原创 kv类型算子使用

kv类型的算子使用

2024-12-10 16:47:27 281

原创 RDD触发算子的使用

spark中的一些触发算子

2024-12-08 23:16:16 319

原创 如何创建一个dws层的设备连续登录表

如何创建一个设备连续登录区间表

2024-12-08 23:09:28 340

原创 RDD转换算子的使用

spark的转换算子

2024-12-07 09:04:37 306

原创 RDD对象

RDD的概述

2024-12-07 09:00:43 180

原创 使用pyspark完成wordcount案例

pyspark的案例wordcount

2024-12-06 20:42:11 292

原创 spark-submit命令总览

在集群上pyspark和spark-submit命令的使用

2024-12-06 20:38:59 558

原创 阿里云中Flink提交作业

阿里云提交flink作业

2024-12-05 23:06:47 399

原创 flinkSql中累计窗口CUMULATE

flinkSql中累积窗口的使用和一个topN案例

2024-12-05 23:03:02 511

原创 在服务器上实现本地python文件的依赖

使用import 在服务器上导入自己写的py文件

2024-12-04 22:39:10 458

原创 flinkSql中滑动窗口的实现

flink中滑动窗口的使用

2024-12-04 22:17:46 358

原创 flinksql的滚动窗口实现

flink滚动窗口的实现

2024-12-04 22:15:39 498

原创 通过flinkSql将kafka和mysql连接

使用flinkSql快速创建mysql和kafka的连接

2024-12-03 23:25:58 697

原创 flinkSql 将流和表的互相转换

表和流的相互转换

2024-12-03 23:22:51 812

原创 flink学习(14)—— 双流join

双流join

2024-12-02 11:34:55 689

原创 flink学习(13)—— 重试机制和维表join

重试机制和维表join

2024-12-02 09:49:35 679

原创 flink学习(12)——checkPoint

checkpoint

2024-11-28 22:19:00 610

原创 flink学习(11)——state

state

2024-11-28 22:16:29 1026

原创 flink学习(10)——allowedLateness/测道输出

allowed和sideOutput的使用

2024-11-27 18:46:39 703

原创 flink学习(9)——time+water mark

watermark的使用

2024-11-27 18:44:05 911

原创 flink学习(8)——窗口函数

指在窗口触发的时候才会对窗口内的所有数据进行一次计算(等窗口的数据到齐,才开始进行聚合计算,可实现对窗口内的数据进行排序等需求)使用方式二:在分流的时候使用,可以通过context.output方法对每个数据添加一个标签。例如:要计算数字之和,进去一个12 计算结果为20, 再进入一个7 ——结果为27。全量聚合函数比较简单,但是会将所有的数据存放在内存中,因此会占用大量的内存空间。使用方式一:在connect合流之后对两个类型不同的流进行处理。

2024-11-26 21:58:36 640

原创 flink学习(7)——window

窗口的使用

2024-11-26 21:55:00 835

原创 kafka生产者和消费者命令的使用

kafka-console-consumer.sh和kafka-console-producer.sh命令的使用

2024-11-25 19:24:43 678

sql练习一hive数据库数据

sql练习一hive数据库数据

2024-09-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除