- 博客(10)
- 资源 (1)
- 收藏
- 关注
原创 SQL语言总结的知识点
背景介绍Titanic数据集是非常适合数据科学和机器学习新手入门练习的数据集。数据集为1912年泰坦尼克号沉船事件中一些船员的个人信息以及存活状况。这些历史数据已经非分为训练集和测试集,你可以根据训练集训练出合适的模型并预测测试集中的存活状况。...
2021-03-29 17:10:04
227
原创 SQL的LIMIT和OFFSET
LIMIT语句很重要,经常用在SQL查询里面。1.单参数SELECT * FROM students LIMIT 2;#返回前2条数据---易错点:以为索引是从0开始的,所以以为是3条,这是不对的!!!返回前x条数据。2.双参数SELECT * FROM students LIMIT 0,2;这里是从第一个参数x开始计算,返回y条,比如说0,2;从索引0开始,返回0、1两条数据。3.OFFSETOFFSET的双参数,可以理解为拆了OFFSET以后倒过来。...
2021-03-24 16:13:01
221
原创 Ubuntu安装的Redis当定义中文返回值乱码时的解决方法
返回值和原始值编码形式不一样。解决方法:启动Redis服务时,使用redis-cli --raw命令行。
2021-03-24 11:03:37
245
原创 Action 2_决策树算法
决策树算法决策树(decision tree)是一种基本的分类与回归方法。分类决策树模型是一种描述对实例进行分类的树形结构。决策树由结点(node)和有向边(directed edge)组成。结点有两种类型:内部结点(internal node)和叶结点(leaf node)。内部结点表示一个特征或属性,叶结点表示一个类。决策树是一个if-then规则的集合,将决策树转换成if-then规则的过程是这样的:由决策树的根结点(root node)到叶结点(leaf node)的每一条路径构建一条规则;路径
2021-03-18 20:43:39
149
原创 Action 1_k-近邻算法
k-近邻算法k-近邻算法采用测量不同特征值之间的距离方法进行分类。其属于分类算法(另一个大类是回归),属于监督学习的范畴(还有非监督学习,监督学习需要注有标记的训练集)。它的工作原理是:存在一个样本数据集合,也称作为训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一个数据与所属分类的对应关系。输入没有标签的新数据后,将新的数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本最相似数据(最近邻)的分类标签。一般来说,我们只选择样本数据集中前k个最相似的数据,这就是k-近邻算法
2021-03-17 16:59:05
139
原创 记录学习数据分析入门(1)——泰坦尼克Titanic(超详细!)
背景介绍Titanic数据集是非常适合数据科学和机器学习新手入门练习的数据集。数据集为1912年泰坦尼克号沉船事件中一些船员的个人信息以及存活状况。这些历史数据已经非分为训练集和测试集,可以根据训练集训练出合适的模型并预测测试集中的存活状况。...
2020-06-23 15:11:47
2783
转载 时间序列预测一些方法以及思想
时间序列预测方法总结 - BINGO Hong的文章 - 知乎https://zhuanlan.zhihu.com/p/67832773这位大佬写的很好哦~~~~
2020-06-05 14:55:03
173
原创 Ubuntu16.04实验常用操作Linux
计算机深度学习新手必备操作(1)最基本之进入文件夹要进入一个目录输入命令:cdcd后面为目录的名字,例如进入根目录命令为:cd /要查看目录则使用ls命令,ls 后面跟目录的名字,例如查看根目录,则输入ls /回车即可查看根目录。()...
2020-05-31 16:11:22
454
原创 PM2.5数据集LSTM时序预测python3代码
PM2.5数据集LSTM实现预测数据集说明主要步骤环境全部代码转化为监督数据导入数据集归一化转化为监督数据删除不需要预测的列分割为训练集和数据集LSTM反归一化真实值与预测值的对比数据集说明本实验采用的PM2.5空气质量数据集来自UCI公共数据集网站,包含了一系列与空气质量有关的天气数据,此数据集为多变量时间序列,每个记录的间隔为一小时,实例数量为43824条,其中前24条未在数据集中使用。该数据集是从2010年初到2014年底收集的美国驻华使馆的空气质量数据,在此实验中选择了具有实值的43800条作为
2020-05-27 17:06:36
3864
4
数据分析泰坦尼克数据集
2020-05-26
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人