- 博客(87)
- 收藏
- 关注
转载 大数据时代的深度学习模型介绍
深度学习(DL, Deep Learning)是机器学习(ML, Machine Learning)领域中一个新的研究方向,它被引入机器学习使其更接近于最初的目标——人工智能(AI, Artificial Intelligence)。 深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。以往在机器学习用于现实任务时,描述样本的特征通常需由人类专家来设计,这称为“
2024-10-11 14:52:34
278
原创 Pandas处理时间序列之预测
通过实际案例演示如何对时间序列数据进行预处理、模型拟合和未来值预测,帮助更好地理解和应用这些强大的时间序列分析工具。
2024-10-11 10:58:42
743
原创 BP神经网络
BP神经网络是一种按照误差逆向传播算法训练的多层前馈神经网络,是应用最广泛的神经网络模型之一,也是目前深度学习的理论基础。目前深度学习网络的参数优化是基于BP和梯度回归的。
2024-10-10 20:42:30
1184
原创 基于LightGBM的数据实践
LightGBM可以说是xgboost上的延续,在xgboost上做了一些优化,从应用层面上来说最直接的两点就是:(1):速度变快了很多,(2):可以支持类别型特征(在xgb中是不可以的,需要one-hot)。
2024-10-10 20:09:47
1069
原创 基于xgboost的分类预测
xgboost以及后续的lightGBM等在我的认知中算是目前数据挖掘中最常用的预测算法,在各种数据挖掘比赛中获得了Top的名次。如果想从事数据挖掘相关的岗位,该算法是一定要好好掌握的
2024-10-10 16:42:37
1696
原创 决策树(descision tree)
决策树(descision tree)是一种基本的分类与回归的方法。决策树是一种对实例进行预测的树型结构。
2024-10-10 15:57:35
1471
原创 K-means算法
k-means算法是一个十分经典的聚类算法,同时它也是一个无监督的算法。对于一组没有标记的数据,如果我们需要将其分为几组的话,这时候我们就可以使用到K-means算法了。
2024-10-10 10:58:55
1495
原创 逻辑回归LogisticRegression
逻辑回归是一个分类模型,它可以用来预测某件事发生是否能够发生。分类问题是生活中最常见的问题:生活中:比如预测上证指数明天是否会上涨,明天某个地区是否会下雨,西瓜是否熟了金融领域:某个交易是否涉嫌违规,某个企业是否目前是否违规,在未来一段时间内是否会有违规互联网:用户是否会购买某件商品,是否会点击某个内容对于已知的结果,上面问题的回答只有:0,1。
2024-10-09 19:37:49
1516
原创 数据指标体系
数据的核心作用之一就是,监控业务的发展变化,从数据中发现潜在的业务问题。在实现通过数据监控业务变化这项功能时,数据指标体系会发挥强大作用。
2023-10-04 00:16:00
2287
原创 容器技术Docker
Docker 是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的镜像中,然后发布到任何流行的 Linux或Windows操作系统的机器上,也可以实现虚拟化。容器是完全使用沙箱机制,相互之间不会有任何接口。
2023-03-30 17:03:53
1641
2
原创 机器学习 —— 聚类算法
聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法,同时也是数据挖掘的一个重要算法。聚类(Cluster)分析是由若干模式(Pattern)组成的,通常,模式是一个度量(Measurement)的向量,或者是多维空间中的一个点。聚类分析以相似性为基础,在一个聚类中的模式之间比不在同一聚类中的模式之间具有更多的相似性。
2022-11-14 16:57:56
3528
原创 机器学习 —— 计算评估指标
AUC是一个模型评价指标,用于二分类模型的评价。AUC是“Area under Curve(曲线下的面积)”的英文缩写,而这条“Curve(曲线)”就是ROC曲线。
2022-11-14 16:29:53
985
原创 机器学习 —— PCA降维和交叉验证
什么是PCA降维:降维,顾名思义,是要把一个M维的数据降为K维,为了方便表示,这里可以表示为将M维的N条样本转化为K维的N条样本,即把一个N*M的矩阵X转换为N*K的矩阵Y。
2022-11-14 08:59:37
1022
原创 机器学习 —— 支持向量机SVM(Support Vector Machine)
Support Vector Machine。支持向量机,其含义是通过支持向量运算的分类器。其中“机”的意思是机器,可以理解为分类器。 那么什么是支持向量呢?在求解的过程中,会发现只根据部分数据就可以确定分类器,这些数据称为支持向量。
2022-11-09 15:57:16
1525
原创 机器学习 —— DecisionTree决策树
不同于逻辑斯蒂回归和贝叶斯算法,决策树的构造过程不依赖领域知识,它使用属性选择度量来选择将元组最好地划分成不同的类的属性。所谓决策树的构造就是进行属性选择度量确定各个特征属性之间的拓扑结构。
2022-11-04 19:03:02
1193
原创 机器学习 —— 逻辑回归 简单介绍与使用
Logistic Regression虽然名字里带“回归”,但是它实际上是一种分类方法,用于两分类问题(即输出只有两种)。
2022-11-03 19:30:13
431
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人