
线性回归
丰。。
这个作者很懒,什么都没留下…
展开
-
线性回归及代码实现
引子初等数学➡已知方程求未知数高等数学→已知未知数,求方程(从数据中获得结论)那么今天就从里面最简单的线性回归(Simple linear regression)开始学起最简单的理解就是通过一些列运算的到初中我们学的y=kx+b第一步,描述数据(数据可视化)比如我们通过散点图看到整个数据,好像是接近一条线(类似于y=kx+b)那样分布的,我们就可以使用简单线性回归进行预测(图为探寻工作年限与薪水的关系)画成热力图这里先引入协方差(covariance)的概念作用:描述多维数据集(标准差原创 2021-04-05 16:29:28 · 2475 阅读 · 1 评论 -
浅谈简单线性回归(Simple linear regression)part10代码实现
import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom scipy import stats# 模型评价# MSE, RMES, R-squarefrom sklearn import metricsrng = np.random.RandomState(1)xtrain = 10 * rng.rand(30)#创建随机数ytrain = 15 + 4 * xtrain + rng.rand原创 2021-04-05 16:08:30 · 165 阅读 · 0 评论 -
浅谈简单线性回归(Simple linear regression)part8.从本源理解线性回归算法
回归分析法是非常常见的算法本质:通过模型抓住信息拟合数据从而达到预测的目的抓一个信息→简单线性回归(一元)→y=kx+b抓住多个信息→多元线性回归→y=b0+k1x1+k2x2+…+knxn但是由此就产生了一个问题,在日常生活中,我们观测到的数据不存在可以使用的通用的能完美拟合所有数据的算法,故我们只能尽力缩小该算法拟合数据的误差,于是为了尽可能地接近我们想计算的数据区间,我们想到了最小二乘法.现在我们把目光转向矩阵,目的在于拟合数据(x1,y1)…(xn,yn)下面把数据分别放入y=kx+b中原创 2021-02-14 21:50:13 · 220 阅读 · 0 评论 -
浅谈简单线性回归(Simple linear regression)part7,伪相关
1,凑巧相关(chance relationship)→某一段时期内凑巧具有相关性2,不是具有直接的相关性(not direct relation)→两个变量的关联由另外一个变量引起这里面分为两种情况1,x,y里面包含了第三变量,2x,y同时与第三个变量相关但是他们之间没有关联...原创 2021-02-10 22:46:14 · 544 阅读 · 0 评论 -
浅谈简单线性回归(Simple linear regression)part5.假设检验2
假设检验与不一定与0检验1假设性检验详见https://blog.csdn.net/CSDNXXCQ/article/details/113145468因为是要拿来拟合的模型,我们当然希望系数b1不为0故我们先设一个靶子H0→b1=0Ha→b1≠02进行t检验3看t值落在正态分布的哪个区间内,比如左边,右边还是中间4得出结论:b1 was significantly different from 0(b1与0显著性不同)→拒绝了H0假设注意,不一定要与0进行判断,这里只是判断b1与0原创 2021-02-01 09:49:40 · 539 阅读 · 0 评论 -
浅谈简单线性回归(Simple linear regression)part4对参数检验的两种方式
1point_estimation(点估计)→一般被认为不太科学(就是点对点,只有模型的参数完全符合该值我们才认为模型是准的),就是part1中讲的从一堆的点数据中得出的b1参数2confidence interval(置信区间)→认为真实的b1是一个波动值,在一定的区间范围内浮动(联想食品包装袋上的±号),如果我们模型跑出来的参数落在了该区间内,我们就认为该模型是准的,具体见假设性检验那篇博文...原创 2021-01-31 22:15:11 · 355 阅读 · 0 评论 -
浅谈简单线性回归(Simple linear regression)part3SEE,MSE,SSE的关系
MSE→均方根误差(各数据偏离真实值 差值的平方和 的平均数 )→Meansquared erroSEE→标准估计误差→standard estimated errors目的:描述真实值与预测值之间的距离SSE→和方差、误差平方和→The sum of squares dueto error观察SEE公式可知,当为0时与SSE公式十分相似...原创 2021-01-31 21:55:06 · 2204 阅读 · 0 评论 -
浅谈简单线性回归(Simple linear regression)part2ANOVA
浅谈简单线性回归(Simple linear regression)part2ANOVAANOVA(方差分析(Analysis of Variance,简称ANOVA))目的:用于表达我们的模型有多拟合数据就是一张表关于这类表,有个推论:TSS = SSE + RSS其中,回归平方和:ESS,残差平方和:RSS,总体平方和:TSS。即总体平方和=回归平方和+误差平方和(总体=预测+误差)参数说明:(1) 实验条件,即不同的处理造成的差异,称为组间差异。用变量在各组的均值与总均值之偏差平方和原创 2021-01-31 16:28:37 · 1322 阅读 · 0 评论 -
浅谈简单线性回归(Simple linear regression)part1原理推导
初等数学➡已知方程求未知数高等数学→已知未知数,求方程(从数据中获得结论)那么今天就从里面最简单的线性回归(Simple linear regression)开始学起最简单的理解就是通过一些列运算的到初中我们学的y=kx+b第一步,描述数据(数据可视化)比如我们通过散点图看到整个数据,好像是接近一条线(类似于y=kx+b)那样分布的,我们就可以使用简单线性回归进行预测(图为探寻工作年限与薪水的关系)画成热力图这里先引入协方差(covariance)的概念作用:描述多维数据集(标准差和方差原创 2021-01-30 23:45:25 · 790 阅读 · 0 评论 -
浅谈简单线性回归(Simple linear regression)part6,离群点的处理
同时做两种方案,1去除离群点2保留离群点然后对比两种方案的拟合效果原创 2021-02-10 22:30:49 · 1712 阅读 · 0 评论