- 博客(32)
- 收藏
- 关注
原创 60天python训练计划----day 32
参考pdpbox官方文档中的其他类,绘制相应的图,任选即可。官方文档的阅读和使用:要求安装的包和文档为同一个版本。官方文档的检索方式:github和官网。DAY 32 官方文档的阅读。绘图的理解:对底层库的调用。普通方法所需要的参数。
2025-05-23 22:23:10
35
原创 60天python训练计划----day31
DAY 31 文件的规范拆分和写法今日的示例代码包含2个部分notebook文件夹内的ipynb文件,介绍下今天的思路项目文件夹中其他部分:拆分后的信贷项目,学习下如何拆分的,未来你看到的很多大项目都是类似的拆分方法知识点回顾规范的文件命名规范的文件夹管理机器学习项目的拆分编码格式和类型注解作业:尝试针对之前的心脏病项目ipynb,将他按照今天的示例项目整理成规范的形式,思考下哪些部分可以未来复用。说明。
2025-05-22 15:13:02
831
原创 60天python训练计划----day30
DAY 30 模块和库的导入知识点回顾:导入官方库的三种手段导入自定义库/模块的方式导入库/模块的核心逻辑:找到根目录(python解释器的目录和终端的目录不一致)
2025-05-19 17:15:10
265
原创 60天python训练计划----day29
我们之前是用复用的思想来看装饰器的,换一个角度理解,当你想修改一个函数的时候,可以通过装饰器方法来修改而无需重新定义这个函数。复习类和函数的知识点,写下自己过去29天的学习心得,如对函数和类的理解,对python这门工具的理解等,未来再过几个专题部分我们即将开启深度学习部分。2. 在类定义外部定义方法,然后把方法赋值给类的属性---这是一种动态方法,常在装饰器中使用,可以再外部修改类的方法。可以的,类也有装饰器。类也有修饰器,他的逻辑类似:接收一个类,返回一个修改后的类。实际上,定义类的方法,有2类写法。
2025-05-19 16:25:32
270
原创 60天python训练计划----day28
calculate_perimeter():计算周长(公式:2×(长+宽))。创建一个工厂函数 create_shape(shape_type, *args),根据类型创建不同图形对象:图形工厂(函数或类)calculate_circumference():计算圆的周长(公式:2πr)。shape_type="rectangle":创建长方形(参数:长、宽)。calculate_area():计算圆的面积(公式:πr²)。calculate_area():计算面积(公式:长×宽)。
2025-05-19 15:20:29
186
原创 60天python训练计划----day27
编写一个装饰器 logger,在函数执行前后打印日志信息(如函数名、参数、返回值)ps:第一期day27对应5月16日。DAY 27 函数专题2:装饰器。装饰器的思想:进一步复用。注意内部函数的返回值。
2025-05-18 15:35:31
178
原创 60天python训练计划----day26
编写一个名为 calculate_circle_area 的函数,该函数接收圆的半径 radius 作为参数,并返回圆的面积。编写一个名为 calculate_average 的函数,该函数可以接收任意数量的数字作为参数(引入可变位置参数 (*args)),并返回它们的平均值。编写一个名为 print_user_info 的函数,该函数接收一个必需的参数 user_id,以及任意数量的额外用户信息(作为关键字参数)。函数的参数类型:位置参数、默认参数、不定参数。user_id 是一个必需的位置参数。
2025-05-15 22:08:20
224
原创 60天python训练计划----day 25
DAY 25 异常处理知识点回顾:异常处理机制debug过程中的各类报错try-except机制try-except-else-finally机制在即将进入深度学习专题学习前,我们最后差缺补漏,把一些常见且重要的知识点给他们补上,加深对代码和流程的理解。作业:理解今日的内容即可,可以检查自己过去借助ai写的代码是否带有try-except机制,以后可以尝试采用这类写法增加代码健壮性。
2025-05-15 14:21:00
611
原创 60天python训练计划----day23
DAY 23 pipeline管道知识回顾:转化器和估计器的概念管道工程ColumnTransformer和Pipeline类作业:整理下全部逻辑的先后顺序,看看能不能制作出适合所有机器学习的通用pipeline。
2025-05-14 15:35:00
1014
原创 60天python训练计划----day20
对于任何矩阵(如结构化数据可以变为:样本*特征的矩阵,图像数据天然就是矩阵),均可做等价的奇异值SVD分解,对于分解后的矩阵,可以选取保留前K个奇异值及其对应的奇异向量,重构原始矩阵,可以通过计算Frobenius 范数相对误差来衡量原始矩阵和重构矩阵的差异。应用:结构化数据中,将原来的m个特征降维成k个新的特征,新特征是原始特征的线性组合,捕捉了数据的主要方差信息,降维后的数据可以直接用于机器学习模型(如分类、回归),通常能提高计算效率并减少过拟合风险。降噪:通常噪声对应较小的奇异值。
2025-05-12 15:40:21
136
原创 60天python训练计划----day19
它的核心逻辑是:计算每个特征与目标变量之间的相关系数(范围在-1到1之间,值越大表示正相关越强,值越小表示负相关越强,接近0表示几乎无关),然后根据相关系数的绝对值大小,选择与目标变量相关性较高的特征,剔除相关性较低的特征。1. 特征筛选:从n个特征中筛选出m个特征,比如方差筛选,剔除方差过小的特征;所以在面对高维特征的时候常常需要引入特征降维,我们之前课程中的项目的特征也就小几十个,不太需要做降维,对于某些特征较多的数据,如基因数据、微生物数据、传感器数据等,特征较多,所以会考虑特征降维。
2025-05-11 22:02:55
677
原创 60天python训练计划----day18
在债务合并用途上表现一致,几乎无破产记录,信用问题极少,资金用途集中且很少涉及特殊类别。财务状况稳定,信用良好,资金流向明确。各项关键财务和信用指标表现优异,显示出良好的财务自律性和信用履约能力,所以定义为 “优质信用稳健财务型”。多数无债务合并需求,破产情况少见,但信用问题上存在个体差异,资金用途有一定分散性。整体财务状况相对稳定,但在信用和资金使用方向上不如第一个簇表现一致。虽然总体财务状况尚可,但信用记录和资金用途的分化情况使其区别于第一个簇,因此定义为 “较稳健但信用有分化财务型”。
2025-05-10 15:20:48
240
原创 60天python训练计划----day17
今天的主题是无监督算法中的聚类,常利用聚类来发现数据中的模式,并对每一个聚类后的类别特征进行可视化,以此得到新的特征---赋予实际含义。知识点 上述内容分成2天的内容来说,今天说聚类算法,明天说基于聚类进一步推断类型。一.聚类评估指标介绍以下是三种常用的聚类效果评估指标,分别用于衡量聚类的质量和簇的分离与紧凑程度:KMeans 是一种基于距离的聚类算法,需要预先指定聚类个数,即 。其核心步骤如下:Agglomerative Clusterin
2025-05-09 22:45:52
686
原创 60天python训练计划----day16
因为前天说了shap,这里涉及到数据形状尺寸问题,所以需要在这一节说清楚,后续的神经网络我们将要和他天天打交道。知识点:numpy数组的创建:简单创建、随机创建、遍历、运算numpy数组的索引:一维、二维、三维SHAP值的深入理解。
2025-05-08 22:20:21
605
原创 60天python训练计划----day15
尝试找到一个kaggle或者其他地方的结构化数据集,用之前的内容完成一个全新的项目,这样你也是独立完成了一个专属于自己的项目。仔细回顾一下之前14天的内容,没跟上进度的同学补一下进度。有数据地址的提供数据地址,没有地址的上传网盘贴出地址即可。1.该数据集全是数值型,没有字符串等分类型信息。,开源的机器学习平台,很多实验数据集。,谷歌做的开源数据集搜索引擎。阿里平台,电商类数据集较多。国内平台,包含经典的数据集。,最早的机器学习数据仓库,(看的群友的数据,哈哈哈)注册,数据集质量自己筛选。
2025-05-08 17:49:11
340
原创 60天python训练计划----day14
参考上述文档补全剩余的几个图尝试确定一下shap各个绘图函数对于每一个参数的尺寸要求,如shap.force_plot力图中的数据需要满足什么形状?确定分类问题和回归问题的数据如何才能满足尺寸,分类采取信贷数据集,回归采取单车数据集。
2025-05-03 06:14:00
348
原创 60天python训练计划----day13
今天的任务是对于不平衡数据集的处理,在面对标签数据时常常会遇到数据占比不均匀的情况,可以看看接下来是如何操作的。
2025-05-02 16:00:59
1015
原创 60天python训练计划----day12
今天介绍下遗传算法,这些算法仅作为你的了解,不需要开始学习,如果以后需要在论文中用到,在针对性的了解下处理逻辑。下面介绍这几种常见的优化算法:1. 遗传算法2. 粒子群优化3. 模拟退火。
2025-05-01 17:05:25
358
原创 60天python训练计划----day 11
今天我们要开始超参数调整的专题了,回归下之前课程说的几个核心知识点:1. 模型 = 算法 + 实例化设置的外参(超参数)+训练得到的内参2. 只要调参就需要考2次所以如果不做交叉验证,就需要划分验证集和测试集,但是很多调参方法中都默认有交叉验证,所以实际中可以省去划分验证集和测试集的步骤。
2025-04-30 20:21:41
236
原创 60天python训练计划----day10
今日任务:1. 把之前所有的处理手段都处理一遍,回顾一下全流程,以后就用处理好的部分直接完成2. 开始机器学习建模(简单建模,不涉及调参)和评估。
2025-04-29 16:59:39
346
原创 60天python训练计划----day7
本案例所使用的数据集源自著名的UCI心脏病数据集。该数据库由克利夫兰医学研究中心提供,其包含76个属性。不过,在所有已发表的论文和实验中,仅使用了其中14个属性的子集。因此,我们的分析和机器学习模型解析也将围绕这14个属性展开,具体如下:1. 年龄(age):病人的年龄,以周岁为单位。2. 性别(sex):病人的性别,其中1代表男性,0代表女性。3. 胸痛情况(cp):胸痛是由于心脏无法获得足够含氧血液而引发的典型症状。具体分为以下几种情况:1:典型心绞痛;2:非典型心绞痛;3:非心绞痛的疼痛。
2025-04-26 16:10:10
662
原创 60天python训练计划----day5
离散特征的独热编码今天的任务分成以下几步1. 读取数据2. 找到所有离散特征3. 选择一个离散特征进行独热编码4. 采取循环对所有离散特征进行独热编码5. 加上昨天的内容 并且处理所有缺失值1.读取数据discrete_features为形参,将data.columns依次传入形参,dtype=='object' 根据列表中的数据判断特是否为离散数据。1. Home Ownership:房屋所有权2. Rent:租房3. Own Home:拥有自有住房。
2025-04-24 20:37:34
389
原创 60天python训练计划----day4
pandas库 是Python的一个数据分析库,它提供了大量的数据结构和函数,用于数据的清洗、处理、分析和可视化。以下是对pandas库的简洁说明:数据结构:主要有 Series(一维数组)和 DataFrame(二维表格),方便处理各种类型的数据。数据处理功能:能进行数据的读取和写入,支持多种文件格式,如CSV、Excel等;可轻松进行数据清洗,包括处理缺失值、重复值等;还能对数据进行分组、合并、重塑等操作。数据分析能力:提供了丰富的统计函数,用于计算均值、中位数、标准差等;
2025-04-23 16:42:22
390
原创 60天python训练计划----day3
1.创建一个包含三个字符串元素的列表 tech_list,元素分别为 “Python”, “Java”, “Go”。4.修改 tech_list 中的第二个元素(索引为 1),将其从 “Java” 更改为 “Ruby”。6.计算当前 tech_list 的长度,并将结果存储在变量 current_length 中。定义一个包含整数的列表 scores,赋值为 [85, 92, 78, 65, 95, 88]。- 28-35度:打印"黄色预警:天气炎热"- 20-27度:打印"绿色提示:适宜温度"
2025-04-22 13:39:45
149
原创 60天python计划----day2
题目: 定义两个整数变量,score_a 赋值为 75,score_b 赋值为 90。比较 score_a 是否大于 score_b,将比较结果(布尔值)存储在变量 is_a_higher 中;比较 score_a 是否小于等于 score_b,将结果存储在变量 is_a_lower_or_equal 中;比较 score_a 是否不等于 score_b,将结果存储在变量 is_different 中。题目1: 定义两个字符串变量,str1 赋值为 “Hello”,str2 赋值为 “Python”。
2025-04-21 20:10:42
180
原创 60天python计划----day 1
题目4: 定义两个浮点数变量,price 赋值为 19.9,discount 赋值为 0.8 (表示 8 折)。计算折扣后的价格,并将结果存储在变量 final_price 中;计算节省了多少钱,存储在变量 saved_amount 中。计算这两个变量的和,并将结果存储在一个新的变量 a 中;计算这两个变量的商,叫做b;计算这两个变量的余数,叫做c。然后,使用 f-string 打印出类似 “20 加 8 的结果是:28” 的信息,分成三行打印。函数将每个变量的值单独打印出来,每个值占一行。
2025-04-20 22:19:00
220
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人