- 博客(57)
- 收藏
- 关注
原创 Python刷题笔记
对三根长度分别为10、24、15的木棒来说,k=7,即需要至少7段长度相等的木棒,此时可以得到最大长度为6,因为在这种情况下,第一根木棒可以提供10/6=1段、第二根木棒可以提供24/6=4段、第三根木棒可以提供15/6=2段,达到了7段的要求。有三根相邻的柱子,标号分别为A、B、C,A柱子按金字塔状叠放着n个不同大小的圆盘,现在要把所有盘子一个一个移动到柱子C上,并且任何时候同一根柱子上都不能出现大盘子在小盘子上方,请问至少需要多少次移动,并给出具体的移动方案。现在给定一个单峰序列,求峰顶位置的下标。
2025-04-10 10:16:52
588
原创 【专题】图论
【一对多】。蓝桥王国有N个建筑和M条单向通道,每条通道都连接两个建筑,每个建筑都有自己的编号,分别为1~N(其中皇宫编号为1)。国王想让小明回答从皇宫到每个建筑的最短路径是多少。第一行输入n,m。第2到M+1行每行有三个正整数u,v,w。表示 u -> v 之间存在一条距离为w的路输出一行,共N个数,分别表示从皇宫到编号为1~N建筑的最短距离。
2025-04-10 10:08:19
526
原创 【专题】简单数论
斐波那契数,通常用 F(n) 表示,形成的序列称为 斐波那契数列。该数列由 0 和 1 开始,后面的每一项数字都是前面两项数字的和。也就是: F(0) = 0,F(1) = 1 F(n) = F(n - 1) + F(n - 2),其中 n > 1 给你n ,请计算 F(n)。但是口袋的承重量有限,装的质数的和不能超过 L。将这些质数从小往大输出,然后输出最多能装下的质数的个数,数字之间用换行隔开。给定一个区间 [a,b],请你求出区间 [a,b] 中所有整数的质因数分解。
2025-04-10 10:07:22
306
原创 【专题】前缀和+差分
【给定一个长度为n的数组a1,a2,…ana_1, a_2,…a_na1,a2,…an.接下来有q次查询, 每次查询有两个参数l, r.对于每个询问, 请输出al+al+1+…+ara_l+a_{l+1}+…+a_ral+al+1+…+ar链接:https://ac.nowcoder.com/acm/problem/226282来源:牛客网。
2025-04-10 10:03:57
928
原创 【专题】贪心算法
现在知道了汽车核载重量为 w,可供选择的物品的数量 n。每个物品的重量为 gi, 价值为 pi。由于 yyy 是蒟蒻,如果要参加一个比赛必须善始善终,而且不能同一时间参加 2 个及以上的比赛。老师想合理的安排答疑的顺序,使得同学们在课程群 里面发消息的时刻之和最小。堆金币的总重量和总价值分别是 mi,vi(1≤mi,vi≤100)。≤1000) 的背包,但并不一定有办法将全部的金币都装进去。老师可以安排答疑的顺序,同学们要依次进入老师办公室答疑。yyy 认为,参加越多的比赛,noip 就能考的越好。
2025-04-10 10:01:59
867
原创 【专题】日期时间
2、定义time对象(时,分,秒)3、定义datetime(年,月,日,时,分,秒)4、计算日期和时间差5、计算两个日期之间的天数差6、时间格式化:将日期时间对象格式化为指定格式的字符串。:解析一个按照特定格式的字符串,并将其转换为一个日期时间对象。7、提取日期元素二:题目练习1、判断闰年给定一个年份,判断其是平年还是闰年。(提示:如果年份是400的倍数,或者是4的倍数但不是100的倍数,那么称这个年份为闰年)2、第几天2000 年的 1 月 1 日,是那一年的第 1天。那
2025-04-10 09:59:34
398
原创 【专题】搜索题型(BFS+DFS)
都可以抽象成一个。如果满足递归的条件,树枝可以无限增加,直到找到所需要数据为止;如果不满足,树枝则会折断。。:N个数按一定规则全排列,有几种排列方式:N个数里面按一定规则找出k个数的集合:一个N个数的集合里有多少符合条件的子集。
2025-04-10 09:57:37
945
原创 【专题】动态规划
斐波那契数,通常用 F(n) 表示,形成的序列称为 斐波那契数列 。该数列由 0 和 1 开始,后面的每一项数字都是前面两项数字的和。也就是: F(0) = 0,F(1) = 1 F(n) = F(n - 1) + F(n - 2),其中 n > 1 给你n ,请计算 F(n) 。动态规划的解题代码块:数据量大的情况由于结果可能很大,因此将结果对10007取模后输出。简单递归的解题代码块:数据量小情况2、数塔《二维》✦✦✦数塔就是由一堆数字组成的塔状结构,其中第一行1个数,第二行2个数,第三行3个数,
2025-04-10 09:55:08
850
原创 大数据技术之HBase操作归纳
步骤一:先点击绿色的小锤子,然后再点击Edit Configurations的选项。Java借助于HBase的API接口来操作HBase。步骤二:进行信息的配置。
2025-02-20 17:09:18
584
原创 【Python】Pandas详解
Pandas详解一、Pandas介绍数据分析三剑客之一的Pandas,是基于Numpy构建的,专门用于【数据处理和分析】的库。它提供了两种主要的数据结构:Series(一维数据结构)和DataFrame(二维数据结构,类似于表格),使得数据的清洗、转换、分析和可视化变得更加容易。DataFrame与Series的联系数据结构关系:【DataFrame可以看作是由多个Series组成的】。其中,DataFrame的每一列都可以视为一个Series,这些Series共享相同的索引。相互转换
2025-01-16 10:04:40
1966
1
原创 【Python】Numpy详解
数据分析三剑客之一的Numpy,是一个用于处理数组的 Python 包【基于数组对象的科学计算库】。 其全名为 “Numeric Python”,是一款开源的Python库。Numpy相当于Python中的列表(List),但只能存放相同的数据类型。引入Numpy的目的是可以计算大型的多维数组和矩阵操作,其计算能力强,运行的速度快。列表(List)需要先寻找元素的地址,再访问到元素;而Numpy的数组被存储在内存中的一个连续的位置【物理地址连续性】,可以非常有效地访问和操作它们。【功能侧重】:主要专注于数值
2025-01-15 10:50:15
1131
原创 【Python】Matplotlib详解
plot()函数的基本格式x和y:【必要参数】,分别是横坐标和纵坐标的数据,可以是列表、数组等可迭代对象。如果只提供y,则x默认是从0开始的整数序列。:【可选参数】,用于指定线条的格式,包括颜色、线型、标记等。例如,'r-'表示红色实线,'bo'表示蓝色圆点标记。**kwargs:【可选参数】,用于更详细地设置线条的属性,如线宽、标记大小、颜色等。在实际应用中,常见的参数类型主要有以下几种【额外配置】:color:设置线条颜色,默认为蓝色。linestyle:设置线条样式,默认为实线。
2025-01-14 13:05:44
3644
1
原创 Flink CDC
CDC全称是Chanage Data Capture(其核心原理就是,将这些,并将**【捕获到的数据】**写入到消息中间件中。如mysql、kakfa(最为典型)等都能实现CDC的功能。在中,通常使用**Flume(面向文件系统)CDC工具(面向关系型数据库组件)**这两个来实现数据采集和ETL功能。
2024-11-20 21:17:41
1172
原创 Kafka-Eagle(可视化监控平台)安装教程
具体路径:vim /opt/software/kafka_2.12-2.8.0/bin/kafka-server-start.sh。命令:vim /opt/software/efak-web-3.0.1/conf/system-config.properties。将安装包放入master01的/opt/download中,解压缩【在download目录下执行下面两个命令即可】官网地址:https://www.kafka-eagle.org/启动的前提条件是先启动Zookeeper、Kafka。
2024-10-26 10:57:29
827
1
原创 Flink加载维度数据
在我们构建实时数仓时,不能光有事实数据,也需要加载维度数据来标明这些事实数据的具体含义。若只含有事实数据的话,就相当于只有数据本身在不断地变化,而并不知道这些数据具体表示什么意思。因此,我们应当加载维度数据进来。
2024-09-23 21:26:25
626
原创 Python爬虫(一文通)
Python爬虫(基本篇)一:静态页面爬取Requests库的使用1)基本概念+安装+基本代码格式应用领域:适合处理**静态页面数据和简单的 HTTP 请求响应**。Requests库的讲解含义:requests 库是 Python 中一个非常简单且强大的库,相当于urllib的升级版(此处不对urllib进行讲解),在Cookie,登录验证,代理设置等操作更加的便利。请求头(UA)UA介绍:UA全名是User Agent,中文名为用户代理。它是一个特殊字符串头,使得服务器能够识
2024-08-29 21:24:41
6988
3
原创 Prometheus & Grafana安装及使用教程
Prometheus和Grafana是两个在监控和数据分析领域非常流行的开源工具。PrometheusGrafanaClickHouse V20.1.2.4中内置了 Prometheus 的访问接口(需开启),直接配置 Prometheus 的 Endpoint服务,会自动将metrics,events,aysnchronous_metrics 三张系统表的数据发送给 Prometheus。
2024-08-14 19:09:56
1822
2
原创 Kafka实战(Scala操作)
版本:具体依赖:2、创建生产者(Producer)一:生产者相关配置讲解::批处理数量,消息为大小,生产者才会发送消息:延迟时间,如果消息大小迟迟不为大小,则可以在指定的时间后发送:重试次数,消息发送失败时,生产者可以再重试次数:ack机制,生产者需要等待个副本成功写入消息后,才认为消息发送成功acks一共有三个选项:键序列化:值序列化二:ProducerRecord讲解:异步发送的普通生产者在异步发送模式下,生产者调用方法发送消息后,不会立即等待服务器的响应,而是继续执行后续操作。异步发送的带
2024-08-03 16:52:38
1175
原创 Kafka基本讲解
Kafka是,主要设计用于高吞吐量的数据处理和消息传输,适用于日志处理、实时数据管道等场景。,用于收集、缓存和分发实时数据流,支持复杂的实时数据处理,实时需求分析,实时报表等应用。
2024-08-02 11:09:47
1642
原创 虚拟机处理yum缓存堆积问题
虚拟机用的时间长了,网络不好,yum显示无法安装。此时我们因考虑到Yum软件包管理器的仓库配置文件地方对方太多而导致的问题。一:首先检查虚拟机设置:确保设备状态中的“✔”都打钩上,并且IOS映射文件没有问题。
2024-08-02 09:30:01
439
原创 Hive之扩展函数(UDF)
此处创建的UDF业务功能介绍:给定三个参数,参数一和参数二为日期,参数三为不同维度(年,季度,月,周,日)。根据不同维度计算两日期之间相差的值。UDF基本接口定义//校验:若无法匹配,则抛异常 public interface UDFCom {//校验传参的数量与元素 default void validateArgs(Object [ ] args , int size) throws UDFArgumentException {
2024-07-29 10:00:04
672
原创 调度器——DolphinScheduler讲解及安装教程
因 SPRING_DATASOURCE_URL 配置中追加 createDatabaseIfNotExist=true,所以无需手动建库。初始密码:dolphinscheduler123。初始用户:admin。
2024-07-22 19:45:44
702
原创 大数据采集工具——Flume简介&安装配置&使用教程
Flume 是一个的,主要用于将大量的数据从(如日志文件、数据库、本地磁盘等)采集到(主要为)中,用来处理日志数据,并支持在数据流中可靠、高效地移动数据。
2024-07-18 21:37:27
2427
1
原创 Docker基本讲解及演示
Docker是一个开源的应用容器引擎,允许开发者将应用程序及其依赖项打包成一个轻量级、可移植的容器,然后发布到任何支持 Docker 的环境中运行,无论是开发机、测试机还是生产环境。Docker基于沙箱技术,每个容器都有自己的独立运行环境,包括操作系统、库文件、配置等,实现了资源隔离和轻量级迁移。
2024-07-16 09:35:15
950
原创 Docker的安装【虚拟机】
官网地址:https://cr.console.aliyun.com/cn-hangzhou/instances/mirrors?:从阿里云的镜像站点下载 CentOS 7 的 yum 仓库配置文件,并将其保存到 /etc/yum.repos.d/ 目录下。:当安装docker仓库时,输入命令:yum -y install yum-utils。若出现以下信息,表示安装docker成功!
2024-07-15 19:35:17
712
原创 Hive的基本操作(查询)
查询字段的【数量】与【类型】必须相同,字段名是以【第一张表为准】。union all:合并后保留重复项 ✔。union:合并后删除重复项(去重)
2024-07-15 10:59:50
1106
原创 Scala之OOP讲解
泛型的定义类型参数化,主要用于【集合不同于 Java ,scala中泛型被定义在 [] 中。/*泛型边界定义上边界:T<:A 泛型为某个类型的子类下边界:T>:A 泛型为某个类型的父类*/// 1.只能是比Father小的类型// 2.只能是比Son大的类型。
2024-07-14 14:10:52
1326
原创 Hive表【汇总】
因此分区表将文件切割成更小的粒度,当需要针对局部数据进行检索、聚合等处理时只需要加载对应的粒度即可,从而提高了处理的效率。在开发中,数据量大的情况下,我们为了针对开发做测试,就可以采用分桶来进行数据采样,采样得到的结果是一个具有代表性的查询结果,可以达到快速开发的目的。外部表允许在 Hive 中定义一个表结构,并对外部存储系统中的数据进行查询和分析,而不会对数据本身进行移动或修改。:最后获取的数据是在每个分区【文件夹】内随机抽取指定数量【如:四分之一]的数据[桶]】=> 抽到的数据[桶]是具有。
2024-07-13 10:47:35
1384
原创 Mysql数据库学习
Mysql是一个具体的关系型数据库管理系统(RDBMS),其支持使用SQL来进行数据的增删改查等操作。Mysql具有许多的优势,包括可移植性,安全性,可跨平台等,适用于各个规模的应用和项目。此处所展示的是MySQL数据库基本的系统库注意:当你初次打开MySQL服务时,会看见mysql,performance_schema,sys,information_schema这四个基本的系统库【不可进行删除修改等操作,即:不要动着四个系统库】。2.1解释别名就是非表的原始部分2.2基本语法[as] 表达式别名说明。
2024-06-24 13:52:01
891
原创 错误:case-to-case inheritance is prohibited
不采用case,而是老老实实的构造参数和伴生对象。:样例类不可以作为继承链路中的叶子结点。
2024-04-28 16:46:15
261
原创 大数据之Hadoop(HDFS读文件)
客户端向NameNode请求下载a.txt文件NmaeNode会通过逻辑映射关系来找到a.txt所对应的block1与block2所对应的id随后通过物理映射关系来确认每个id所对应的存储在DN的全路径并返还给客户端一个较近较闲置的DN(先返还DN1所对应的全路径,DN1操作完后,再返回DN2所对应的全路径,以此类推,具有先后顺序)客户端拿到block1在DN1对应的全路径后,读取数据块block1将数据传回客户端客户端将block1的数据传入本地文件。
2024-04-18 13:54:40
575
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人