- 博客(11)
- 收藏
- 关注
原创 机器学习算法—最小角回归
最小角回归(Least Angle Regression, LARS)是一种用于高维线性回归问题的算法,它能够在特征数量远大于样本数量的情况下有效工作。LARS结合了逐步回归和岭回归的优点,提供了一种高效且稳定的参数估计方法。
2025-03-30 19:44:52
430
原创 机器学习算法—弹性网络
总体而言,模型表现尚可,尤其是在识别出真正的有效特征方面。但是,由于多重共线性和噪声的存在,模型也错误地将一些无关特征视为重要特征。
2025-03-29 21:18:18
1267
原创 机器学习算法—Lasso回归
Lasso通过引入L1正则化(即系数绝对值之和),能够将一些不重要的特征的系数压缩为零。这种稀疏性使得Lasso不仅是一个回归模型,还是一个特征选择工具。它可以帮助我们在高维数据中筛选出最重要的变量,从而简化模型并提高解释性。正则化的目的是防止过拟合。在普通最小二乘法中,如果特征之间存在多重共线性(即特征高度相关),或者特征数量远大于样本数量,模型可能会过度拟合训练数据,导致在测试数据上的表现不佳。Lasso通过对系数施加惩罚,限制了模型的复杂度,从而提高了泛化能力。
2025-03-27 20:12:14
1852
原创 机器学习算法—岭回归
在传统的最小二乘法线性回归中,我们的目标是找到一组参数 β 使得预测值与实际观测值之间的误差平方和最小。然而,在存在多重共线性的情况下,即自变量之间高度相关时,这种直接的方法可能会导致不稳定的参数估计。岭回归通过在损失函数中加入一个惩罚项来解决这个问题,从而控制模型复杂度并提高预测性能。
2025-03-26 21:19:54
695
原创 机器学习算法—线性回归
线性回归是一种通过描述因变量(y)与一个或多个自变量(x1,x2,…,xn)之间依赖关系的统计方法。其核心公式为:β0:截距项;βj:(j=1,2,…,n):回归系数,表示自变量xj对y的影响强度;ϵ:误差项,假设服从均值为0的正态分布:仅含一个自变量:含多个自变量。
2025-03-24 21:04:48
574
原创 vba办公自动化(4)—从word文件导入数据
现有一组数据,记录在word文档中,如下图:如果上述数据是通过word表格建立的,那么该数据实际上是一组二维数据,每个数据都有分隔标识,直接通过复制粘贴,到excel表格里就会填入相对应的行与列。然而,我们看到,该组数据并没有建立word表格,而是通过空格分割的,虽然人眼看来是一组14行3列的数据,但计算机只能识别为一个夹杂着字母、数字、特殊符号、空格和换行符的字符串,如果进行复制粘贴,全部数据都会写入到一个单元格内。面对这种问题,可以通过以下思路解决:1.获取word应用程序对象。
2025-03-21 21:00:30
389
原创 vba办公自动化(1)— 提取出生日期
6.遍历身份证号列,将当前行的身份证号赋值给 idNumber变量。用if条件语句判断身份证号是否为18位,若值为真,则提取7到14位,将提取数值转换为日期格式,这里启用了错误处理,以防无效日期导致程序中断执行。将转换后的日期填入B列,并设置为yyyy年mm月dd日的格式。在建立人员名册时,经常利用已有的人员身份证号来提前人员出生日期,面对大量信息时,手动提取工作量过大,利用excel内置的MID函数和TEXT函数,操作也较为繁琐,现利用vba,简单解决该问题。当前工作表名称根据实际情况自行修改。
2025-03-17 21:49:33
164
原创 创建DeepSeek本地知识库
3.进入dify的github仓库,获取下载地址https://github.com/langgenius/dify.git,打开终端,用git clone命令安装镜像(需提前在本机安装git);6.在dify页面进入设置,模型供应商选择ollama,url填写docker容器内部ip,详情查看dify官方文档;5.输入http://localhost/install启动dify;1.访问dokcer官网,下载安装dokcer(可移植容器);7.dify主页面上点击知识库,按提示提交文本数据即可。
2025-02-01 17:31:01
494
原创 DeepSeek本地部署方法
3.win+r cmd 打开终端,输入ollama run deepseek-r1:1.5b指令,等待安装;4.在chatbox中,将模型提供方选择为ollama API;5.模型选择deepseek-r1:1.5b;1.进入https://chatboxai.app/zh,下载chatbox,或直接在网页使用;启动模型:ollama run deepseek-r1:1.5b(这里选择的是1.5b模型);2.在ollama官网搜索deepseek-r1,根据个人电脑显存大小,选择合适的模型;
2025-01-31 19:41:28
337
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人