自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(25)
  • 收藏
  • 关注

原创 机器学习算法基础-决策树与随机森林

决策树与随机森林决策树特征选择信息增益决策树代码实例决策树优缺点分析决策树的优点决策树的缺点集成方法(分类)之随机森林学习算法实例代码决策树决策树模型呈树形结构。在分类问题中,表示基于特征对实例进行分类的过程,它可以认为是if-then规则的集合。在决策树的结构中,每一个实例都被一条路径或者一条规则所覆盖。通常决策树学习包括三个步骤:特征选择、决策树的生成和决策树的修剪优点:计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理逻辑回归等不能解决的非线性特征数据缺点:可能产生过度匹配问题

2021-10-21 13:21:30 520

原创 机器学习算法基础-模型的选择

机器学习的几种分类一级目录二级目录三级目录一级目录二级目录三级目录算法是核心,数据和计算是基础。这句话很好的说明了机器学习中算法的重要性。那么我们开看下机器学习的几种分类:监督学习 分类 k-近邻算法、决策树、贝叶斯、逻辑回归(LR)、支持向量机(SVM) 回归 线性回归、岭回归 标注 隐马尔可夫模型(HMM)无监督学习 聚类 k-means...

2021-10-19 16:23:43 450

原创 机器学习算法基础-sklearn数据集与机器学习组成

sklearn数据集与机器学习组成开发机器学习应用程序的步骤scikit-learn数据集sklearn.datasetsdatasets.load_*()datasets.fetch_*()datasets.make_*()开发机器学习应用程序的步骤(1)收集数据我们可以使用很多方法收集样本护具,如:制作网络爬虫从网站上抽取数据、从RSS反馈或者API中得>到信息、设备发送过来的实测数据。(2)准备输入数据得到数据之后,还必须确保数据格式符合要求。(3)分析输入数据这一步的主要作用是

2021-10-14 17:26:33 376

原创 机器学习算法基础-数据降维

机器学习算法基础二数据降维特征选择特征选择的原因特征选择的方法Filter-过滤式主成分分析数据降维特征选择特征选择的原因冗余:部分特征的相似性高,容易消耗计算性能噪声:部分特征对预测结果有影响特征选择的方法Filter-过滤式该方法使用sklearn.feature_selection.VarianceThresholdVarianceThreshold(threshold=0.0):删除所有低方差特征主成分分析本质:一种分析,简化数据集的技术目的:尽可能降低原数据的维度

2021-10-14 17:07:12 143

原创 机器学习算法基础(一)

机器学习算法基础一机器学习算法的基本开发流程sklearn介绍字典特征抽取文本特征提取英文文本特征提取中文文本特征提取TF- IDF算法特征预处理归一化标准化机器学习算法的基本开发流程获取数据-》数据处理-》特征工程-》机器学习算法训练-》模型-》模型评估-》应用sklearn介绍字典特征抽取def dict_demo(): """ 字典特征抽取 :return: """ data = [{'city': '北京','temperature':100}, {'city

2021-10-09 23:09:47 174

原创 Python机器学习数据科学包-Matplotlib

Python机器学习数据科学包-MatplotlibMatplotlib入门散点图折线图条形图直方图柱状图饼状图Matplotlib入门散点图from pylab import *n = 1024X = np.random.normal(0,1,n)Y = np.random.normal(0,1,n)scatter(X,Y)show()折线图import numpy as npimport matplotlib.pyplot as pltx = np.linspace(-10

2021-03-29 17:25:03 922

原创 Python机器学习数据科学包-pandas

Python机器学习数据科学包-pandas1. ipython开发环境搭建1. ipython开发环境搭建ipython是一个 python 的交互式 shell,比默认的python shell 好用得多,支持变量自动补全,自动缩进,支持 bash shell 命令,内置了许多很有用的功能和函数。##搭建ipython开发环境pip install jupyterpip install numpypip install matplotlibwindows下还要额外安装pyreadlin

2020-12-04 15:49:25 761

原创 Python机器学习数据科学包-numpy

Python机器学习数据科学包-numpy1. numpy创建矩阵2. numpy的基础运算2.1 矩阵的加减2.2 矩阵的幂2.3 矩阵和数字的比较操作2.4 矩阵的乘法2.5 矩阵的其他运算2.5.1 生成随机矩阵2.5.2 矩阵的求和,最大值,最小值2.5.3 矩阵的转置2.5.4 矩阵的clip操作2.5.5 矩阵的行和列遍历2.5.6 矩阵的展开2.6 矩阵的合并2.7 矩阵的分割2.8 矩阵的拷贝1. numpy创建矩阵#创建矩阵,并指定矩阵元素类型array = np.array([[1

2020-11-30 14:33:24 404

原创 Python数据结构与算法系列六:树

树1. 树的概念1.1 树的种类1.2 树的存储与表示1.3 常见的一些树的应用场景2. 二叉树2.1 二叉树的基本概念2.2 二叉树的性质(特性)2.2.1 完全二叉树2.2.2 满二叉树3. 二叉树的节点表示以及树的创建4. 二叉树的遍历4.1 深度优先遍历4.2 广度优先遍历(层次遍历)1. 树的概念树(英语:tree)是一种抽象数据类型(ADT)或是实作这种抽象数据类型的数据结构,用来模拟具有树状结构性质的数据集合。它是由n(n>=1)个有限节点组成一个具有层次关系的集合。把它叫做“树”

2020-11-06 10:35:13 143

原创 Python数据结构与算法系列五:排序与搜索(下)

排序和搜索下1. 归并排序1.1 归并排序的分析1.2 时间复杂度2. 常见排序算法效率比较3. 搜索3.1 二分法查找3.2 二分法查找实现3.3 时间复杂度1. 归并排序归并排序是采用分治法的一个非常典型的应用。归并排序的思想就是先递归分解数组,再合并数组。将数组分解最小之后,然后合并两个有序数组,基本思路是比较两个数组的最前面的数,谁小就先取谁,取了后相应的指针就往后移一位。然后再比较,直至一个数组为空,最后把另一个数组的剩余部分复制过来即可。1.1 归并排序的分析def merge_

2020-11-05 21:57:51 246

原创 Python数据结构与算法系列五:排序与搜索(上)

排序和搜索1. 排序定义1.1 排序算法的稳定性1.2 冒泡排序1.2.1 时间复杂度1. 排序定义排序算法(英语:Sorting algorithm)是一种能将一串数据依照特定顺序进行排列的一种算法。1.1 排序算法的稳定性稳定性:稳定排序算法会让原本有相等键值的纪录维持相对次序。也就是如果一个排序算法是稳定的,当有两个相等键值的纪录R和S,且在原本的列表中R出现在S之前,在排序过的列表中R也将会是在S之前。当相等的元素是无法分辨的,比如像是整数,稳定性并不是一个问题。然而,假设以下的数对

2020-10-26 22:21:18 613

原创 Python数据结构与算法系列四:栈和队列

栈和队列1. 栈1.1 定义1.2 栈结构实现1.2.1 栈的操作1.2.3 测试2. 单端队列2.1 实现2.1.1 操作2.2.2 测试3. 双端队列3.1 操作3.2 实现1. 栈1.1 定义栈(stack),有些地方称为堆栈,是一种容器,可存入数据元素、访问元素、删除元素,它的特点在于只能允许在容器的一端(称为栈顶端指标,英语:top)进行加入数据(英语:push)和输出数据(英语:pop)的运算。没有了位置概念,保证任何时候可以访问、删除的元素都是此前最后存入的那个元素,确定了一种默认的访

2020-10-22 09:31:52 512

原创 Python数据结构与算法系列三:链表

链表的定义1. 链表定义1.1 链表的优点2. 单向链表2.1 节点实现2.2 单链表的操作2.3 单链表的实现2.3.1 头部添加元素2.3.2 尾部添加元素2.3.3 指定位置添加元素2.3.4 删除节点2.3.5 查找节点是否存在2.3.6 测试2.4 单向链表和顺序表的比较1. 链表定义链表(Linked list)是一种常见的基础数据结构,是一种线性表,但是不像顺序表一样连续存储数据,而是在每一个节点(数据存储单元)里存放下一个节点的位置信息(即地址)。1.1 链表的优点顺序表的构

2020-10-19 15:09:23 729

原创 Python数据结构与算法系列二:顺序表

顺序表1. 顺序表定义1.1 基本类型顺序表1.2 外置类型顺序表2. 顺序表的结构和实现2.1 顺序表的结构2.2 顺序表的两种实现方式2.2.1 一体式结构2.2.2 分离式结构2.2.3 两种实现方式的比较3. 顺序表的操作3.1 增加元素3.2 删除元素4. 动态顺序表4.1 扩充的两种策略5. Python中的顺序表5.1 list的基本实现技术1. 顺序表定义将元素顺序地存放在一块连续的存储区里,元素间的顺序关系由它们的存储顺序自然表示的一种数据结构1.1 基本类型顺序表对于元素类

2020-10-14 09:21:41 483

原创 Python数据结构与算法系列一:入门

算法1. 算法定义1.1 算法的五大特征2. 时间复杂度与大O表示法2.1 时间复杂度2.2 时间复杂度的基本计算规则2.3 常见时间复杂度及其大小关系2.3.1 常见时间复杂度2.3.2 常见时间复杂度大小关系1. 算法定义算法是独立存在的一种解决问题的方法和思想。1.1 算法的五大特征输入:算法具有0个或多个输入输出:算法至少又一个或多个输出有穷性:算法在有限的步骤后自动结束而不会无限循环,并且每一个步骤可以在可接受的时间内完成确定性:算法中的每一步都有确定的含义,不会出现二义性可

2020-10-12 21:22:45 498 1

原创 Python基础系列十:模块和包

模块和包1. 模块定义2. 模块化编程的流程3. 模块导入3.1 import导入模块的方式3.2 import导入的模块类别3.3 from 模块 import 函数/类4. 模块的加载4.1 模块的动态加载5. 包package5.1 包package的概念5.2 包的导入5.3 __init__.py6. sys.path和模块搜索路径7. 模块的发布和使用7.1 本地模块的发布和安装7.1.1 模块发布7.1.2 安装模块7.1.3 使用模块7.2 PyPI官网_远程上传和管理模块7.2.1 远程

2020-10-04 13:37:27 773 1

原创 Python基础系列九:文件操作

文件1. 文本文件和二进制文件2. 创建文件对象open()3.编码问题3.1 常见编码介绍3.2 中文乱码问题1. 文本文件和二进制文件按文件中数据组织形式,文件可以分为文本文件和二进制文件文本文件:存储的字符文本,Python中默认unicode字符集(两个字节表示一个字符,共65536个字符),可以用记事本打开。二进制文件: 存储的字节文件,不能用记事本打开,常见的二进制文件有mp4视频,jpg图片,doc文档等。2. 创建文件对象open()open()函数用于创建对象,创建格式如

2020-09-25 09:45:17 841

原创 Python基础系列八:异常

异常1. 异常机制本质2. try...except结构3. try...多个except结构4. try...except...else结构5. try...except...finally结构6. with上下文管理7. traceback模块8. 自定义异常类1. 异常机制本质异常指程序运行过程中出现的非正常现象,例如用户输入错误、除数为零、需要处理的文件不存在、数组下标越界等。异常处理,指程序在出现问题时依然可以正确执行剩下的程序,而不会因为异常终止程序的执行。2. try…excep

2020-09-22 12:40:27 273

原创 Python基础系列七:面向对象

面向对象面向对象简介面向对象简介

2020-09-15 10:40:51 1056

原创 Python基础系列六:函数

函数1. Python函数类型2. 函数的定义和调用3. 形参和实参4. 函数注释5. 返回值1. Python函数类型Python中的函数可以分为以下几类:内置函数str 、list()、len()等这些都是内置函数标准库函数可以使用import导入库,使用库中的函数第三方库函数第三方提供的库,也是使用import导入库,使用库中的函数用户自定义函数用户在开发中为适应自身需求定义的函数2. 函数的定义和调用核心要点:我们使用def来定义函数,然后就是一个空格和函数名称

2020-09-11 16:32:42 527

原创 Python基础系列五:推导式创建序列

推导式创建序列推导式创建序列1 列表推导式2 字典推导式3 集合推导式推导式创建序列推导式是从一个或者多个迭代器快速创建序列的一种方法。它可以将循环和条件判断结合,从而避免冗长的代码。推导式是典型的Python风格。1 列表推导式列表推导式生成列表对象,语法如下:[表达式 for item in 可迭代对象]或者[表达式 for item in 可迭代对象 if 条件判断]循环的嵌套[表达式 for item in 可迭代对象 for item in 可迭代对象][x for x

2020-09-11 15:33:17 220

原创 Python基础系列四:控制语句

控制语句1. 选择结构1.1 单分支选择结构1.2 双分支选择结构1.2.1 三元条件运算符1.3 多分支选择结构1.3.1 条件表达嵌套语句1.4 条件表达式详解2. 循环结构2.1 while循环1. 选择结构选择结构通过判断条件是否成立,来决定执行哪个分支。1.1 单分支选择结构s = input("please input a word:")if int(s)<10: print("s是小于10")1.2 双分支选择结构s = input("please input

2020-09-11 09:05:28 135

原创 Python基础系列三:序列

Python序列序列1. 列表1.1 列表操作1.2 列表的创建1.2.1 基本语法[]创建1.2.2 list()创建1.2.3 range()创建整数列表1.2.4 推导式生成列表1.3 列表元素的添加1.3.1 append()1.3.2 +运算符操作1.3.3 extend()方法1.3.4 insert插入元素1.3.5 乘法扩展1.4 列表元素的删除1.4.1 del删除1.4.2 pop()方法1.4.3 remove()方法1.4.4 列表元素访问1.4.4.1 通过索引直接访问元素1.4.

2020-09-09 11:19:35 1013

原创 Python基础系列二:数据类型

Python数据类型

2020-09-04 16:07:04 585

原创 Python基础系列一:入门

文章目录Python简介应用范围缺点版本和兼容性问题Python解释器Python安装和配置Python开发环境IDLEPython程序格式缩进大小写行注释段注释Python程序的构成Python对象对象的定义对象在内存中的表示引用变量与内存标识符Python标识符命名规则变量变量的声明和赋值变量的删除和垃圾回收机制Python简介Python是一种解释性、面向对象型的语言。具有简洁,面向对象、免费和开源、可移植性和跨平台(Python会被编译成与操作系统相关的二进制代码,然后再解释执行。这种方式和ja

2020-09-03 16:10:11 896

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除