
机器学习笔记
MYcsdn6666
这个作者很懒,什么都没留下…
展开
-
机器学习之笔记-k阶近邻算法
K阶近邻算法概念: 谷近邻算法采用测量不同特征值之间的距离方法进行分类工作原理: k-近邻算法(kNN),它的工作原理是:存在一个样本数据集合,也称作训练集样本集,并且样本集中每个数据都存在标签,集我们知道样本集中每一个数据与所属分类的对应关系.输入没有的标签的新数据后,将新数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本中特征醉相似数据(最近邻)的分类标签.一般来...原创 2018-06-25 15:09:44 · 1273 阅读 · 0 评论 -
机器学习之数据集的基本操作
#导入需要用的工具包import numpy as npimport pandas as pd#1.先创建一个时间索引,所谓的索引(index)就是每一行数据的id,可以标识每一行的唯一值#dates=pd.date_range('20180701',periods=6)dates #2.创建一个6X4的数据:randn函数用于创建随机数,参数表示行数和列数,dates是...原创 2018-07-02 08:46:07 · 2813 阅读 · 0 评论 -
机器学习之笔记-实战前基本概念理解
1.脑图 2.基本模型 基本模型 类别 线性模型 线性回归、logistic 回归、SVM 集成学习模型 (随机森林、GBDT) 数据预处理 数据清洗、特征工程、降维、聚类3.机器学习分类 分类 类别 监督学习(Supervised Learning) 分类(Classification)...原创 2018-06-28 19:48:39 · 1615 阅读 · 2 评论 -
机器学习之简单实战-共享单车
注:本篇文章旨在对机器学习处理流程进行梳理,不代表结果如何,只为熟悉实战过程,不够接下来的实例回对此实例问题进行修正 此实例存在问题: 1)normalize是标准化,另外你这里分别对训练和测试数据标准化是有问题的。分别处理会导致数据分布变得不一样。 2)数据特征工程做的少,类别型特征没有处理。 3)模型跑出来之后,完全没有结果的解析1.项目名称: 某自行车数...原创 2018-06-29 07:57:21 · 3518 阅读 · 0 评论