Python应用-机器学习kNN算法

最新推荐文章于 2024-12-01 18:22:23 发布

Radish_c

最新推荐文章于 2024-12-01 18:22:23 发布

阅读量2.2k

点赞数 22

文章标签： python 机器学习算法

本文链接：https://blog.csdn.net/c_grass_c/article/details/134792689

版权

第1关：kNN算法原理

任务描述

本关任务：通过学习本关知识，完成选择题。

闯关要求

根据所学知识完成右侧选择题。

开始你的任务吧，祝你成功！

答案
AD
A

第2关：使用sklearn中的kNN算法进行分类

任务描述

本关任务：编写一个能对数据进行分类的程序。

编程要求

请仔细阅读右侧代码，根据方法内的提示，在Begin - End区域内进行代码补充，具体任务如下：

完成classification函数。函数需要完成的功能是使用KNeighborsClassifier对test_feature进行分类。其中函数的参数如下：
train_feature: 训练集数据；
train_label: 训练集标签；
test_feature: 测试集数据。

测试说明

补充完代码后，点击测评，平台会对你编写的代码进行测试，当你的结果与预期输出一致时，即为通过。

平台会对你返回的预测结果来计算准确率，你只需完成classification函数即可。准确率高于0.75视为过关。

预期输出：你的准确率高于0.75

开始你的任务吧，祝你成功！

from sklearn.neighbors import KNeighborsClassifier

def classification(train_feature, train_label, test_feature):
    '''
    使用KNeighborsClassifier对test_feature进行分类
    :param train_feature: 训练集数据
    :param train_label: 训练集标签
    :param test_feature: 测试集数据
    :return: 测试集预测结果
    '''

    #********* Begin *********#
    clf = KNeighborsClassifier()
    clf.fit(train_feature,train_label)
    predict_result = clf.predict(test_feature)
    return predict_result
    #********* End *********#

第3关：使用sklearn中的kNN算法进行回归

任务描述

本关任务：编写一个能对数据进行回归的程序。

编程要求

请仔细阅读右侧代码，根据方法内的提示，在Begin - End区域内进行代码补充，具体任务如下：

完成regression函数。函数需要完成的功能是使用KNeighborsRegressor对test_feature进行分类。其中函数的参数如下：
train_feature: 训练集数据；
train_label: 训练集标签；
test_feature: 测试集数据。

测试说明

平台会对你返回的预测结果来计算准确率，你只需完成regression函数即可。r2 score高于0.75视为过关。

预期输出：你的r2 score高于0.75。

开始你的任务吧，祝你成功！

from sklearn.neighbors import KNeighborsRegressor

def regression(train_feature, train_label, test_feature):
    '''
    使用KNeighborsRegressor对test_feature进行分类
    :param train_feature: 训练集数据
    :param train_label: 训练集标签
    :param test_feature: 测试集数据
    :return: 测试集预测结果
    '''

    #********* Begin *********#
    clf = KNeighborsRegressor()
    clf.fit(train_feature,train_label)
    predict_result = clf.predict(test_feature)
    return predict_result
    #********* End *********#

第4关：分析红酒数据

任务描述

本关任务：编写Python代码，实现平均酒精含量的功能。

编程要求

请仔细阅读右侧代码，根据方法内的提示，在Begin - End区域内进行代码补充，完成alcohol_mean函数。该函数需要完成返回红酒数据中的平均酒精含量。其中函数的参数解释如下:

data：红酒数据对象。

测试说明

补充完代码后，点击测评，平台会对你编写的代码进行测试，当你的结果与预期输出一致时，即为通过。

预期输出：平均酒精含量计算正确。

开始你的任务吧，祝你成功


import numpy as np

def alcohol_mean(data):
    '''
    返回红酒数据中红酒的酒精平均含量
    :param data: 红酒数据对象
    :return: 酒精平均含量，类型为float
    '''

    #********* Begin *********#
    # 提取红酒数据中的酒精含量特征
    alcohol_feature = data['data'][:, 0]

    # 计算酒精含量的平均值
    mean_alcohol = np.mean(alcohol_feature)

    return mean_alcohol
    #********* End **********#

第5关：对数据进行标准化

任务描述

本关任务：编写Python代码，实现标准化数据的功能。

编程要求

请仔细阅读右侧代码，根据方法内的提示，在Begin - End区域内进行代码补充，完成scaler函数。该函数需要完成是返回标准化后的数据。其中函数的参数解释如下:

data：红酒数据对象。

测试说明

补充完代码后，点击测评，平台会对你编写的代码进行测试，当你的结果与预期输出一致时，即为通过。

预期输出：标准化成功

开始你的任务吧，祝你成功！

from sklearn.preprocessing import StandardScaler

def scaler(data):
    '''
    返回标准化后的红酒数据
    :param data: 红酒数据对象
    :return: 标准化后的红酒数据，类型为ndarray
    '''

    #********* Begin *********#
    # 获取红酒数据的特征部分
    features = data['data']

    # 实例化StandardScaler对象
    scaler = StandardScaler()

    # 用数据的均值和标准差进行标准化
    standardized_data = scaler.fit_transform(features)

    return standardized_data
    #********* End **********#

第6关：使用kNN算法进行预测

任务描述

本关任务：编写Python代码，实现红酒分类功能。

编程要求

请仔细阅读右侧代码，根据方法内的提示，在Begin - End区域内进行代码补充，完成classification函数。该函数需要完成是对测试数据进行红酒分类，并将分类结果返回。其中函数的参数解释如下:

train_feature：训练集数据，类型为ndarray；
train_label：训练集标签，类型为ndarray；
test_feature：测试集数据，类型为ndarray。

测试说明

补充完代码后，点击测评，平台会对你编写的代码进行测试，当你的结果与预期输出一致时，即分类准确率高于0.92视为过关。

预期输出：你的分类准确率高于0.92。

开始你的任务吧，祝你成功！

from sklearn.neighbors import KNeighborsClassifier
from sklearn.preprocessing import StandardScaler

def classification(train_feature, train_label, test_feature):
    '''
    对test_feature进行红酒分类
    :param train_feature: 训练集数据，类型为ndarray
    :param train_label: 训练集标签，类型为ndarray
    :param test_feature: 测试集数据，类型为ndarray
    :return: 测试集数据的分类结果
    '''

    #********* Begin *********#
        # 实例化StandardScaler对象，用于标准化数据
    scaler = StandardScaler()

    # 对训练集和测试集数据进行标准化
    train_feature_standardized = scaler.fit_transform(train_feature)
    test_feature_standardized = scaler.transform(test_feature)


    knn_classifier = KNeighborsClassifier()

    # 使用训练集数据进行模型训练
    knn_classifier.fit(train_feature_standardized, train_label)

    # 对测试集数据进行分类
    predictions = knn_classifier.predict(test_feature_standardized)

    return predictions
    #********* End **********#

觉得有用就点个赞，让创作更有动力哦😉🥱