自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(57)
  • 收藏
  • 关注

原创 Python刷题笔记

对三根长度分别为10、24、15的木棒来说,k=7,即需要至少7段长度相等的木棒,此时可以得到最大长度为6,因为在这种情况下,第一根木棒可以提供10/6=1段、第二根木棒可以提供24/6=4段、第三根木棒可以提供15/6=2段,达到了7段的要求。有三根相邻的柱子,标号分别为A、B、C,A柱子按金字塔状叠放着n个不同大小的圆盘,现在要把所有盘子一个一个移动到柱子C上,并且任何时候同一根柱子上都不能出现大盘子在小盘子上方,请问至少需要多少次移动,并给出具体的移动方案。现在给定一个单峰序列,求峰顶位置的下标。

2025-04-10 10:16:52 588

原创 【专题】图论

【一对多】。蓝桥王国有N个建筑和M条单向通道,每条通道都连接两个建筑,每个建筑都有自己的编号,分别为1~N(其中皇宫编号为1)。国王想让小明回答从皇宫到每个建筑的最短路径是多少。第一行输入n,m。第2到M+1行每行有三个正整数u,v,w。表示 u -> v 之间存在一条距离为w的路输出一行,共N个数,分别表示从皇宫到编号为1~N建筑的最短距离。

2025-04-10 10:08:19 526

原创 【专题】简单数论

斐波那契数,通常用 F(n) 表示,形成的序列称为 斐波那契数列。该数列由 0 和 1 开始,后面的每一项数字都是前面两项数字的和。也就是: F(0) = 0,F(1) = 1 F(n) = F(n - 1) + F(n - 2),其中 n > 1 给你n ,请计算 F(n)。但是口袋的承重量有限,装的质数的和不能超过 L。将这些质数从小往大输出,然后输出最多能装下的质数的个数,数字之间用换行隔开。给定一个区间 [a,b],请你求出区间 [a,b] 中所有整数的质因数分解。

2025-04-10 10:07:22 306

原创 【专题】进制转换

含义:得到一个十六进制数,并将其转换回整数。函数可以将十进制整数转换为二进制。函数并指定基数为 2。

2025-04-10 10:05:15 207

原创 【专题】前缀和+差分

【给定一个长度为n的数组a1,a2,…ana_1, a_2,…a_na1,a2,…an.接下来有q次查询, 每次查询有两个参数l, r.对于每个询问, 请输出al+al+1+…+ara_l+a_{l+1}+…+a_ral+al+1+…+ar链接:https://ac.nowcoder.com/acm/problem/226282来源:牛客网。

2025-04-10 10:03:57 928

原创 【专题】贪心算法

现在知道了汽车核载重量为 w,可供选择的物品的数量 n。每个物品的重量为 gi, 价值为 pi。由于 yyy 是蒟蒻,如果要参加一个比赛必须善始善终,而且不能同一时间参加 2 个及以上的比赛。老师想合理的安排答疑的顺序,使得同学们在课程群 里面发消息的时刻之和最小。堆金币的总重量和总价值分别是 mi,vi(1≤mi,vi≤100)。≤1000) 的背包,但并不一定有办法将全部的金币都装进去。老师可以安排答疑的顺序,同学们要依次进入老师办公室答疑。yyy 认为,参加越多的比赛,noip 就能考的越好。

2025-04-10 10:01:59 867

原创 【专题】日期时间

2、定义time对象(时,分,秒)3、定义datetime(年,月,日,时,分,秒)4、计算日期和时间差5、计算两个日期之间的天数差6、时间格式化:将日期时间对象格式化为指定格式的字符串。:解析一个按照特定格式的字符串,并将其转换为一个日期时间对象。7、提取日期元素二:题目练习1、判断闰年给定一个年份,判断其是平年还是闰年。(提示:如果年份是400的倍数,或者是4的倍数但不是100的倍数,那么称这个年份为闰年)2、第几天2000 年的 1 月 1 日,是那一年的第 1天。那

2025-04-10 09:59:34 398

原创 【专题】搜索题型(BFS+DFS)

都可以抽象成一个。如果满足递归的条件,树枝可以无限增加,直到找到所需要数据为止;如果不满足,树枝则会折断。。:N个数按一定规则全排列,有几种排列方式:N个数里面按一定规则找出k个数的集合:一个N个数的集合里有多少符合条件的子集。

2025-04-10 09:57:37 945

原创 【专题】动态规划

斐波那契数,通常用 F(n) 表示,形成的序列称为 斐波那契数列 。该数列由 0 和 1 开始,后面的每一项数字都是前面两项数字的和。也就是: F(0) = 0,F(1) = 1 F(n) = F(n - 1) + F(n - 2),其中 n > 1 给你n ,请计算 F(n) 。动态规划的解题代码块:数据量大的情况由于结果可能很大,因此将结果对10007取模后输出。简单递归的解题代码块:数据量小情况2、数塔《二维》✦✦✦数塔就是由一堆数字组成的塔状结构,其中第一行1个数,第二行2个数,第三行3个数,

2025-04-10 09:55:08 850

原创 Scala基础语法

通常一行一条命令,。。【导包】,过程中定义函数,也可以在【导包】。

2025-03-07 16:36:21 768

原创 大数据技术之HBase操作归纳

步骤一:先点击绿色的小锤子,然后再点击Edit Configurations的选项。Java借助于HBase的API接口来操作HBase。步骤二:进行信息的配置。

2025-02-20 17:09:18 584

原创 【Python】Pandas详解

Pandas详解一、Pandas介绍数据分析三剑客之一的Pandas,是基于Numpy构建的,专门用于【数据处理和分析】的库。它提供了两种主要的数据结构:Series(一维数据结构)和DataFrame(二维数据结构,类似于表格),使得数据的清洗、转换、分析和可视化变得更加容易。DataFrame与Series的联系数据结构关系:【DataFrame可以看作是由多个Series组成的】。其中,DataFrame的每一列都可以视为一个Series,这些Series共享相同的索引。相互转换

2025-01-16 10:04:40 1966 1

原创 【Python】Numpy详解

数据分析三剑客之一的Numpy,是一个用于处理数组的 Python 包【基于数组对象的科学计算库】。 其全名为 “Numeric Python”,是一款开源的Python库。Numpy相当于Python中的列表(List),但只能存放相同的数据类型。引入Numpy的目的是可以计算大型的多维数组和矩阵操作,其计算能力强,运行的速度快。列表(List)需要先寻找元素的地址,再访问到元素;而Numpy的数组被存储在内存中的一个连续的位置【物理地址连续性】,可以非常有效地访问和操作它们。【功能侧重】:主要专注于数值

2025-01-15 10:50:15 1131

原创 【Python】Matplotlib详解

plot()函数的基本格式x和y:【必要参数】,分别是横坐标和纵坐标的数据,可以是列表、数组等可迭代对象。如果只提供y,则x默认是从0开始的整数序列。:【可选参数】,用于指定线条的格式,包括颜色、线型、标记等。例如,'r-'表示红色实线,'bo'表示蓝色圆点标记。**kwargs:【可选参数】,用于更详细地设置线条的属性,如线宽、标记大小、颜色等。在实际应用中,常见的参数类型主要有以下几种【额外配置】:color:设置线条颜色,默认为蓝色。linestyle:设置线条样式,默认为实线。

2025-01-14 13:05:44 3644 1

原创 SparkGraphX讲解

Spark GraphX 是一个分布式图处理框架,为图计算和图挖掘提供了简洁易用且丰富多彩的接口。

2024-12-27 10:02:06 1328

原创 Flink CDC

CDC全称是Chanage Data Capture(其核心原理就是,将这些,并将**【捕获到的数据】**写入到消息中间件中。如mysql、kakfa(最为典型)等都能实现CDC的功能。在中,通常使用**Flume(面向文件系统)CDC工具(面向关系型数据库组件)**这两个来实现数据采集和ETL功能。

2024-11-20 21:17:41 1172

原创 Kafka-Eagle(可视化监控平台)安装教程

具体路径:vim /opt/software/kafka_2.12-2.8.0/bin/kafka-server-start.sh。命令:vim /opt/software/efak-web-3.0.1/conf/system-config.properties。将安装包放入master01的/opt/download中,解压缩【在download目录下执行下面两个命令即可】官网地址:https://www.kafka-eagle.org/启动的前提条件是先启动Zookeeper、Kafka。

2024-10-26 10:57:29 827 1

原创 51单片机基本知识

此处以长方形的封装图为例。电源时钟控制和I/O引脚。

2024-10-08 13:15:00 714

原创 Flink加载维度数据

在我们构建实时数仓时,不能光有事实数据,也需要加载维度数据来标明这些事实数据的具体含义。若只含有事实数据的话,就相当于只有数据本身在不断地变化,而并不知道这些数据具体表示什么意思。因此,我们应当加载维度数据进来。

2024-09-23 21:26:25 626

原创 Python爬虫(一文通)

Python爬虫(基本篇)一:静态页面爬取Requests库的使用1)基本概念+安装+基本代码格式应用领域:适合处理**静态页面数据和简单的 HTTP 请求响应**。Requests库的讲解含义:requests 库是 Python 中一个非常简单且强大的库,相当于urllib的升级版(此处不对urllib进行讲解),在Cookie,登录验证,代理设置等操作更加的便利。请求头(UA)UA介绍:UA全名是User Agent,中文名为用户代理。它是一个特殊字符串头,使得服务器能够识

2024-08-29 21:24:41 6988 3

原创 Prometheus & Grafana安装及使用教程

Prometheus和Grafana是两个在监控和数据分析领域非常流行的开源工具。PrometheusGrafanaClickHouse V20.1.2.4中内置了 Prometheus 的访问接口(需开启),直接配置 Prometheus 的 Endpoint服务,会自动将metrics,events,aysnchronous_metrics 三张系统表的数据发送给 Prometheus。

2024-08-14 19:09:56 1822 2

原创 Kafka实战(Scala操作)

版本:具体依赖:2、创建生产者(Producer)一:生产者相关配置讲解::批处理数量,消息为大小,生产者才会发送消息:延迟时间,如果消息大小迟迟不为大小,则可以在指定的时间后发送:重试次数,消息发送失败时,生产者可以再重试次数:ack机制,生产者需要等待个副本成功写入消息后,才认为消息发送成功acks一共有三个选项:键序列化:值序列化二:ProducerRecord讲解:异步发送的普通生产者在异步发送模式下,生产者调用方法发送消息后,不会立即等待服务器的响应,而是继续执行后续操作。异步发送的带

2024-08-03 16:52:38 1175

原创 Kafka基本讲解

Kafka是,主要设计用于高吞吐量的数据处理和消息传输,适用于日志处理、实时数据管道等场景。,用于收集、缓存和分发实时数据流,支持复杂的实时数据处理,实时需求分析,实时报表等应用。

2024-08-02 11:09:47 1642

原创 虚拟机处理yum缓存堆积问题

虚拟机用的时间长了,网络不好,yum显示无法安装。此时我们因考虑到Yum软件包管理器的仓库配置文件地方对方太多而导致的问题。一:首先检查虚拟机设置:确保设备状态中的“✔”都打钩上,并且IOS映射文件没有问题。

2024-08-02 09:30:01 439

原创 Hive之扩展函数(UDF)

此处创建的UDF业务功能介绍:给定三个参数,参数一和参数二为日期,参数三为不同维度(年,季度,月,周,日)。根据不同维度计算两日期之间相差的值。UDF基本接口定义//校验:若无法匹配,则抛异常 public interface UDFCom {//校验传参的数量与元素 default void validateArgs(Object [ ] args , int size) throws UDFArgumentException {

2024-07-29 10:00:04 672

原创 调度器——DolphinScheduler讲解及安装教程

因 SPRING_DATASOURCE_URL 配置中追加 createDatabaseIfNotExist=true,所以无需手动建库。初始密码:dolphinscheduler123。初始用户:admin。

2024-07-22 19:45:44 702

原创 Mysql深入讲解(索引、事务、锁机制)

一个索引只包含单个列,而一个表中可含有多个单列索引。

2024-07-20 19:05:22 945

原创 大数据采集工具——Flume简介&安装配置&使用教程

Flume 是一个的,主要用于将大量的数据从(如日志文件、数据库、本地磁盘等)采集到(主要为)中,用来处理日志数据,并支持在数据流中可靠、高效地移动数据。

2024-07-18 21:37:27 2427 1

原创 Spark集群搭建

现有机器:master01,master02,worker01。

2024-07-17 19:12:33 1681

原创 Hive理论讲解

hive理论讲解

2024-07-16 19:40:52 495

原创 Docker基本讲解及演示

Docker是一个开源的应用容器引擎,允许开发者将应用程序及其依赖项打包成一个轻量级、可移植的容器,然后发布到任何支持 Docker 的环境中运行,无论是开发机、测试机还是生产环境。Docker基于沙箱技术,每个容器都有自己的独立运行环境,包括操作系统、库文件、配置等,实现了资源隔离和轻量级迁移。

2024-07-16 09:35:15 950

原创 Docker的安装【虚拟机】

官网地址:https://cr.console.aliyun.com/cn-hangzhou/instances/mirrors?:从阿里云的镜像站点下载 CentOS 7 的 yum 仓库配置文件,并将其保存到 /etc/yum.repos.d/ 目录下。:当安装docker仓库时,输入命令:yum -y install yum-utils。若出现以下信息,表示安装docker成功!

2024-07-15 19:35:17 712

原创 Hive的基本操作(查询)

查询字段的【数量】与【类型】必须相同,字段名是以【第一张表为准】。union all:合并后保留重复项 ✔。union:合并后删除重复项(去重)

2024-07-15 10:59:50 1106

原创 Scala之OOP讲解

泛型的定义类型参数化,主要用于【集合不同于 Java ,scala中泛型被定义在 [] 中。/*泛型边界定义上边界:T<:A 泛型为某个类型的子类下边界:T>:A 泛型为某个类型的父类*/// 1.只能是比Father小的类型// 2.只能是比Son大的类型。

2024-07-14 14:10:52 1326

原创 Hive表【汇总】

因此分区表将文件切割成更小的粒度,当需要针对局部数据进行检索、聚合等处理时只需要加载对应的粒度即可,从而提高了处理的效率。在开发中,数据量大的情况下,我们为了针对开发做测试,就可以采用分桶来进行数据采样,采样得到的结果是一个具有代表性的查询结果,可以达到快速开发的目的。外部表允许在 Hive 中定义一个表结构,并对外部存储系统中的数据进行查询和分析,而不会对数据本身进行移动或修改。:最后获取的数据是在每个分区【文件夹】内随机抽取指定数量【如:四分之一]的数据[桶]】=> 抽到的数据[桶]是具有。

2024-07-13 10:47:35 1384

原创 Hive的基本操作(创建与修改)

【代码】Hive的基本操作(创建与修改)

2024-07-09 09:42:57 476

原创 Mysql数据库学习

Mysql是一个具体的关系型数据库管理系统(RDBMS),其支持使用SQL来进行数据的增删改查等操作。Mysql具有许多的优势,包括可移植性,安全性,可跨平台等,适用于各个规模的应用和项目。此处所展示的是MySQL数据库基本的系统库注意:当你初次打开MySQL服务时,会看见mysql,performance_schema,sys,information_schema这四个基本的系统库【不可进行删除修改等操作,即:不要动着四个系统库】。2.1解释别名就是非表的原始部分2.2基本语法[as] 表达式别名说明。

2024-06-24 13:52:01 891

原创 Git教程(从0到1)

记录文件状态内容的地方,存储修改的历史记录。

2024-06-12 09:41:10 395

原创 错误:case-to-case inheritance is prohibited

不采用case,而是老老实实的构造参数和伴生对象。:样例类不可以作为继承链路中的叶子结点。

2024-04-28 16:46:15 261

原创 大数据之Hadoop(HDFS读文件)

客户端向NameNode请求下载a.txt文件NmaeNode会通过逻辑映射关系来找到a.txt所对应的block1与block2所对应的id随后通过物理映射关系来确认每个id所对应的存储在DN的全路径并返还给客户端一个较近较闲置的DN(先返还DN1所对应的全路径,DN1操作完后,再返回DN2所对应的全路径,以此类推,具有先后顺序)客户端拿到block1在DN1对应的全路径后,读取数据块block1将数据传回客户端客户端将block1的数据传入本地文件。

2024-04-18 13:54:40 575 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除