K-近邻算法的 sklearn 实现

cnn-jxx

已于 2024-04-23 13:12:07 修改

阅读量1.1k

点赞数 13

文章标签：近邻算法 sklearn 算法机器学习 python

于 2024-04-23 11:37:53 首次发布

本文链接：https://blog.csdn.net/csdnjxx/article/details/138118382

版权

本文介绍了如何使用Python和sklearn库中的K-近邻分类算法对二手房样本进行分类，包括数据预处理、模型构建、参数优化以及预测性能的评估过程。作者详细展示了从数据导入到模型应用的完整步骤。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

实验目的与要求
1. 掌握基于 K-近邻分类算法的编程方法
2. 通过编程理解 K-近邻分类算法和该算法的基本步骤
实验器材
1. 硬件：PC 机（参与实验的学生每人一台）
2. 软件环境：Python3.7 + Pycharm
实验内容
1. 使用 sklearn 库中的 neighbors 模块实现 K-近邻算法，并对二手房样本所
  属类别进行预测，程序流程为：
  (1) 导入 sklearn 库中的 K-近邻算法模块(KNeighborsClassifier)，数据集分割模块(train_test_split)以及机器学习准确率评估模块(metrics)
  (2) 读取数据，并分割成特征属性集和类别集
  (3) 将数据集分割成训练集和测试集
  (4) 构建模型
  (5) 利用循环语句，k 值取 1-8 分别训练模型以确定最优 k 值
  (6) 使用最优 k 值训练模型并对新样本[7，27]和[2，4]的类别进行预测
  (7) 使用测试集对模型进行测试
  (8) 预测新样本类别
  (9) 绘制分类边界图
数据集下载
本实验的数据集可以点击此处去下载
代码实现

# coding = utf-8
# 导入必要的库
import numpy as np
import matplotlib.pyplot as plt
from sklearn.neighbors import KNeighborsClassifier
from sklearn import metrics  #引入机器学习的准确率评估模
from sklearn.model_selection import train_test_split  #数据分割模块
from sklearn.model_selection import cross_val_score  #交叉验证模块

# 导入数据
X1,y1=[],[]
fr = open('./knn.txt')
for line in fr.readlines():
    lineArr = line.strip().split()
    X1

最低0.47元/天解锁文章