【Python】sklearn LinearRegression 一元线性回归预测并得出回归方程

最新推荐文章于 2025-03-11 16:45:34 发布

milkign

最新推荐文章于 2025-03-11 16:45:34 发布

阅读量1.5k

点赞数

分类专栏： Python3 文章标签： python sklearn 线性回归

本文链接：https://blog.csdn.net/milkign/article/details/128094878

版权

创建模型

# 创建模型
model = LinearRegression()
# 将数据转化成DataFrame
x = pd.DataFrame({
   'salary': salary})
x = x['salary'].values.reshape((

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

milkign

关注关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

[Python从零到壹] 十二.机器学习之回归分析万字总结全网首发（线性回归、多项式回归、逻辑回归）

杨秀璋的专栏

07-03

5万+

前一篇文章讲述了数据分析部分，主要普及网络数据分析的基本概念，讲述数据分析流程和相关技术，同时详细讲解Python提供的若干第三方数据分析库，包括Numpy、Pandas、Matplotlib、Sklearn等。本文介绍回归模型的原理知识，包括线性回归、多项式回归和逻辑回归，并详细介绍Python Sklearn机器学习库的LinearRegression和LogisticRegression算法及回归分析实例。进入基础文章，希望对您有所帮助。

第三章-回归预测法：一元线性回归和多元线性回归分析-带例题（Python&Excel）

所念皆星河

09-25

1416

第三章-回归预测法-一元线性回归和多元线性回归分析-带例题。付款时间与所购商品价值之间存在显著的相关关系，由图 1 看出付款时间与所购商品价值之间呈现明显的线性关系，即付款时间与所购商品价值之间为正相关。截距的t检验P值为0.157，在显著性水平为0.99情况下，不拒绝原假设，说明。：通过Python计算得出付款时间为3分钟时，所购商品的置信度为99%的。付款时间与所购商品价值之间是否存在显著的相关关系。

参与评论您还未登录，请先登录后发表或查看评论

sklearn- 一元线性回归

weixin_44632711的博客

11-16

1053

# sklearn完成机器学习的常用的库,算法封装在程序中，只需调用接口就可以使用机器学习算法 from sklearn.linear_model import LinearRegression import numpy as np import matplotlib.pyplot as plt # 载入数据 data = np.genfromtxt("data.csv", delimiter=",") x_data = data[:,0] y_data = data[:,1] plt.scatter(x

sklearn实现一元线性回归 【Python机器学习系列（五）】

侯小啾技术博客

08-07

3379

sklearn实现一元线性回归 【Python机器学习系列（五）】

sklearn实现一元线性回归

zdx2585503940的博客

03-11

1410

sklearn（Scikit-learn）是Python中用于机器学习的一个非常流行的库，它提供了大量的算法和工具来构建和评估模型。线性回归是统计学中用于预测一个或多个自变量（特征）和一个因变量（目标）之间线性关系的方法。回归是一种应用广泛的预测建模技术,这种技术的核心在于预测的结果是连续型变量。sklearn中的线性模型模块是linear_model，linear_model包含了多种多样的类和函数，我们使用LinearRegression类来进行线性回归。我们使用的是广告投入与销售额之前关系的数据。

机器学习：利用sklearn方法的一元线性回归模型（通过成绩预测绩点）

AI~天海的博客

09-02

1577

这是之前学习线性回归时做的模型，精简版如果去掉注释只用了16行~~ 首先需要数据：一个班级内所有人某课程的成绩、所有人最后的平均绩点（当然数据越多越好） 72 2.5 81 2.98 61 1.76 81 2.89 72 2.24 56 2.25 68 2.03 60 1.97 60 2.16 89 2.48 73 2.22 60 1.9 72 2.29 86 2.69

sklearn——一元线性回归

shanshuyue的博客

11-06

850

from sklearn.linear_model import LinearRegression import numpy as np import matplotlib.pyplot as plt # 载入数据 data = np.genfromtxt("data.csv", delimiter=",") x_data = data[:,0] y_data = data[:,1] plt.scatter(x_data,y_data) plt.show() print(x_data.shape) x

sklearn之线性回归

卢国舅的博客

11-26

2234

0 知识搬运工这个文章介绍的含详细，在这里直接放上链接。 https://blog.csdn.net/hubingshabi/article/details/80172608 为了增强学习效果，现在按照上面的文章，将过程敲打出来。 1 引言 线性回归(Linear Regression)是利用数理统计中回归分析，来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法 线性回归利用...

python中的linearregression_【python+机器学习（2）】python实现Linear Regression

weixin_39972567的博客

12-13

1012

欢迎关注哈希大数据微信公众号【哈希大数据】python实现多元线性回归算法(lr)想必大家在很早之前就接触过函数的概念，即寻找自变量和因变量之间的对应关系，一元一次、多元一次、一元二次等等，表示的就是变量间具有线性、非线性，相关关系或无关关系等。同样的在机器学习中，一个重要而且很常见的问题就是学习特征变量(自变量)与响应变量(因变量)之间的函数关系，进而对新出现的变量进行结果预测。这种寻找连续变量...

机器学习算法基础——sklearn求一元线性回归

小黄的博客

11-13

474

一元线性回归包含一个因变量一个自变量；这两个变量的关系采用一条直线来模拟 y = ax + b from sklearn.linear_model import LinearRegression # 线性回归 import numpy as np import matplotlib.pyplot as plt # 载入数据 data = np.genfromtxt("C:\\ML\\chap...

Python实现机器学习一（实现一元线性回归）

热门推荐

XXiaoLEI的专栏

10-24

2万+

回归是统计学中最有力的工具之一。机器学习监督学习算法分为分类算法和回归算法两种，其实就是根据类别标签分布类型为离散型、连续性而定义的。顾名思义，分类算法用于离散型分布预测，如前面讲过的KNN、决策树、朴素贝叶斯、adaboost、SVM、Logistic回归都是分类算法；回归算法用于连续型分布预测，针对的是数值型的样本，使用回归，可以在给定输入的时候预测出一个数值，这是对分类方法的提升，因为这样可

用sklearn实现一元线性回归

gh6267的博客

08-17

493

from sklearn.linear_model import LinearRegression import numpy as np import matplotlib.pyplot as plt data = np.genfromtxt("data.csv", delimiter=",") x_data = data[:, 0, np.newaxis] y_data = data[:,...

sklearn - 一元线性回归

weixin_40533189的博客

05-13

450

form sklearn.linear_model import LinearRegression import numpy as np import matplotlib.pyplot as plt data = np.genfromtxt('data.csv' , delimiter = ",") x_data = data[:,0] y_data = data[:,1] plt.sca...

【机器学习实战】使用sklearn中的LinearRegression或SGDRegressor实现波士顿房价的回归预测

在热爱技术的路上一直前行。

05-17

1872

1. 数据集 —— 波士顿房价给定的这些特征，是专家们得出的影响房价的结果属性。我们此阶段不需要自己去探究特征是否有用，只需要使用这些特征。到后面量化很多特征需要我们自己去寻找 2. 实现 2.1 代码 from sklearn.datasets import load_boston from sklearn.model_selection import train_test_split from sklearn.preprocessing import StandardScaler from s

机器学习-sklearn-一元线性回归

weixin_42030577的博客

04-16

479

首先导入要用到的包 from sklearn.linear_model import LinearRegression import numpy as np import matplotlib.pyplot as plt 载入数据 data = np.genfromtxt(r"G:\work\python\jupyter_notebook_work\机器学习\回归\data.csv",delimi...

sklearn-线性回归

2301_77698138的博客

08-18

1950

sklearn（Scikit-learn）是Python中用于机器学习的一个非常流行的库，它提供了大量的算法和工具来构建和评估模型。线性回归是统计学中用于预测一个或多个自变量（特征）和一个因变量（目标）之间线性关系的方法。回归是一种应用广泛的预测建模技术,这种技术的核心在于预测的结果是连续型变量。在sklearn中，线性回归可以通过LinearRegression类来实现。线性回归模型易于理解和解释，模型的参数（系数和截距）直接反映了自变量对因变量的影响。但是预测能力有限，比如数据比较复杂的时候。

详解使用sklearn实现一元线性回归和多元线性回归

iioSnail的博客

10-18

7882

简单的线性回归就是使用一根直线去拟合一种趋势。例如：我们有一批房屋面积与房价的数据。X = [100, 110, 120, 130, 140] # 房屋面积（m^2）y = [100 * 1, 110 * 1.05, 120 * 1.1, 130 * 0.95, 140 * 0.9] # 房价（万元）plt.show()此时，我们通过观察图像，可以假设房屋面积与房价是呈一种线性关系的。房价a∗房屋面积b房价=a * 房屋面积 + b房价a∗房屋面积b。但我们并不知道aaa和。

一元线性回归模型实验

最新发布

03-26

### 一元线性回归模型的实验代码与数据分析 #### 实验概述在一元线性回归中，目标是建立一个描述因变量 \(y\) 和自变量 \(x\) 关系的简单线性方程。该关系通常表示为： \[ y = \beta_0 + \beta_1 x + \epsilon \] 其中，\( \beta_0 \) 是截距，\( \beta_1 \) 是斜率，而 \( \epsilon \) 表示随机误差[^3]。以下是基于 Python 的一元线性回归实现及其数据分析过程。 --- #### 数据准备为了演示一元线性回归的过程，可以创建一组简单的模拟数据作为例子。假设我们有一组关于广告费用（自变量）和销售额（因变量）的数据。 ```python import numpy as np import pandas as pd from sklearn.linear_model import LinearRegression import matplotlib.pyplot as plt # 创建虚拟数据集 np.random.seed(42) X = 2 * np.random.rand(100, 1) # 自变量 (广告费用) y = 4 + 3 * X + np.random.randn(100, 1) # 因变量 (销售额)，加入噪声 data = pd.DataFrame(np.c_[X.ravel(), y.ravel()], columns=['Advertising', 'Sales']) print(data.head()) ``` 上述代码生成了一个包含两列的数据框：`Advertising`（广告费用）和 `Sales`（销售额）。这些数据用于后续建模和分析。 --- #### 模型构建利用 Scikit-Learn 库中的 `LinearRegression` 类来完成模型训练。 ```python # 初始化并训练模型 model = LinearRegression() model.fit(X, y) # 输出模型参数 intercept = model.intercept_[0] coefficient = model.coef_[0][0] print(f"Intercept (β0): {intercept:.2f}") print(f"Coefficient (β1): {coefficient:.2f}") ``` 通过以上代码，我们可以得到回归方程的具体形式。例如，在本例中可能获得如下结果： \[ y = 4.18 + 2.95x \] 这表明每增加单位广告费用，预计销售额会提高约 2.95 单位[^2]。 --- #### 可视化分析绘制散点图以及拟合后的回归直线可以帮助直观理解两者之间的关系。 ```python plt.scatter(X, y, color='blue', label="Data Points") # 散点图 plt.plot(X, model.predict(X), color='red', linewidth=2, label="Fitted Line") # 回归线 plt.xlabel('Advertising') plt.ylabel('Sales') plt.title('Simple Linear Regression Example') plt.legend() plt.show() ``` 此部分展示了如何将实际观测值与理论预测值对比，从而评估模型性能。 --- #### 模型评价除了可视化外，还可以计算一些统计指标以量化模型的表现，比如决定系数 (\(R^2\)) 或均方根误差 (RMSE)。 ```python from sklearn.metrics import mean_squared_error, r2_score # 预测值 predictions = model.predict(X) # 计算 R² 和 RMSE r2 = r2_score(y, predictions) rmse = np.sqrt(mean_squared_error(y, predictions)) print(f"R-squared: {r2:.2f}") print(f"Root Mean Squared Error: {rmse:.2f}") ``` 这里引入了两个重要概念： - **决定系数**(\(R^2\)): 越接近于 1，则说明模型越能解释数据的变化。 - **均方根误差**(RMSE): 数值越低越好，代表平均偏差程度较小[^1]。 --- #### 结果解读最终得出的结果不仅提供了定量衡量标准，还揭示了输入特征对于输出的影响强度。这对于进一步优化业务策略具有重要意义。 --- ###