本文相当于目录方便快速检索内容,没有实际内容,只做索引 |
---|
新能源行业知识体系-------主目录-----持续更新https://blog.csdn.net/grd_java/article/details/140004020 |
---|
目录
一、Excel
https://blog.csdn.net/grd_java/article/details/140174090 |
---|
- 数据清洗
- 软件操作技巧
- 数据透视表
- 图表
二、常用数据分析方法和思维模型
必会 的数据分析法 |
---|
研究数据的分布特征和分布类型,分定量数据、定性数据区分基本统计量
两个相互联系的指标进行比较
- 统计分析:
统计指标对定量数据进行统计描述,场从集中趋势和离中趋势两个方面进行分析
- 帕累托分析:
帕累托分析(贡献度分析)->帕累托法则:20/80定律
- 正态性检验:
利用观测数据判断总体是否服从正态分布的检验称为正态性检验,是统计判决中重要的一种特殊的拟合优度假设检验
分析连续变量之间的线性相关程度的强弱
分析法(分析工具,扩展知识,了解即可)https://blog.csdn.net/grd_java/article/details/140540141 |
---|
- 对比分析法
- 分组分析法
- 结构分析法
- 交叉分析法
- 矩阵分析法
- 杜邦分析法
- 漏斗图分析法
思维模型(了解即可)https://blog.csdn.net/grd_java/article/details/141159334 |
---|
- REST分析法
- 4P营销理论
- AARRR模型
- 用户行为理论
- 5W2H分析法
- 逻辑树
三、Python和第三方库
0. Python基础
Python基础:https://blog.csdn.net/grd_java/article/details/109238647 |
---|
0. Numpy
Numpy:https://blog.csdn.net/grd_java/article/details/143175054 |
---|
0. pandas
pandas:https://blog.csdn.net/grd_java/article/details/143279731 |
---|
0. matplotlib
matplotlib:https://blog.csdn.net/grd_java/article/details/144036532 |
---|
四、Mysql
Mysql卸载与安装:https://blog.csdn.net/grd_java/article/details/105929442 |
---|
Mysql语法:https://blog.csdn.net/grd_java/article/details/105747428 |
---|
Mysql数据存储和优化:https://blog.csdn.net/grd_java/article/details/123033016 |
---|
五、Python爬虫
https://blog.csdn.net/grd_java/article/details/140574349 |
---|
六、数学
算法或理论 | 用到的数学知识点 |
---|---|
贝叶斯分类器 | 随机变量,贝叶斯公式,随机变量独立性,正态分布,最大似然估计 |
决策树 | 概率,熵,Gini 系数 |
KNN算法 | 距离函数 |
主成分分析 | 协方差矩阵,散布矩阵,拉格朗日乘数法,特征值与特征向量 |
流形学习 | 流形,最优化,测地线,测地距离,图,特征值与特征向量 |
线性判别分析 | 散度矩阵,逆矩阵,拉格朗日乘数法,特征值与特征向最 |
支持向量机 | 点到平面的距离,Slater条件,强对偶,拉格朗日对偶,KKT条件,凸优化,核函数,Mercer条件 |
Logistic | 概率,随机变量,最大似然估计,梯度下降法,凸优化,牛顿法 |
随机森林 | 抽样,方差 |
AdaBoost 算法 | 概率,随机变量,最大似然估计,梯度下降法,凸优化,牛顿法 |
隐马尔可夫模型 | 概率,离散型随机变量,条件概率,随机变量独立性,拉格朗日乘数法,最大似然估计 |
条件随机场 | 条件概率,数学期望,最大似然估计 |
高斯混合模型 | 正态分布,最大似然估计,Jensen不等式 |
人工神经网络 | 梯度下降法,链式法则 |
卷积神经网络 | 梯度下降法,链式法则 |
循环神经网络 | 梯度下降法,链式法则 |
生成对抗网络 | 梯度下降法,链式法则,极值定理,Kullback-Leibler散度,Jensen-Shannon散度,测地距离,条件分布,互信息 |
K-means算法 | 距离函数 |
贝叶斯网络 | 条件概率,贝叶斯公式,图 |
VC维 | Hoeffding 不等式 |
微积分基础:https://blog.csdn.net/grd_java/article/details/144348388 |
---|
线性代数:https://blog.csdn.net/grd_java/article/details/144374811 |
---|
多元函数微分学:https://blog.csdn.net/grd_java/article/details/144389229 |
---|
线性代数进阶:https://blog.csdn.net/grd_java/article/details/144393637 |
---|
概率论:https://blog.csdn.net/grd_java/article/details/144426089 |
---|
最优化:https://blog.csdn.net/grd_java/article/details/144442094 |
---|
七、机器学习
https://blog.csdn.net/grd_java/article/details/144257225 |
---|
特征工程和机器学习算法
七、深度学习
基础:https://blog.csdn.net/grd_java/article/details/143924745 |
---|
介绍常用的算法模型,并为每个算法搭配难度适中的案例,包括:
- 线性回归和梯度下降算法
- 逻辑回归算法模型
- 全连接神经网络
- 卷积神经网络
- 循环神经网络
八、数学建模
保证自己的python安装了如下模块
- numpy安装命令:pip install numpy。Numpy是好用的数值计算第三方库,非常好用,但是如果需要深度学习的tensorflow包(或者scipy,scikit-learn,pandas),就无需额外安装这个,因为numpy是它们的基础库,以包含在内
- scipy安装命令:pip install scipy。scipy是提供科学计算的第三方库,牛的很
- pulp安装命令:pip install pulp
- networkx安装命令:pip install networkx
- pandas安装命令:pip install pandas。是数据分析的一个第三方库
- matplotlib安装命令:pip install matplotlib。matplotlib是数据可视化的一个库,包括下面的seaborn也是
- seaborn安装命令:pip install seaborn
- scikit-learn是机器学习库,pip install scikit-learn
- tensorflow是深度学习库(注意这个库有400多兆,相对来说真的很大,并且这个包含了numpy,如果要使用这个包,上面就不用安装numpy了),pip install tensorflow
评价模型:https://blog.csdn.net/grd_java/article/details/143140643 |
---|