- 博客(14)
- 收藏
- 关注
原创 常见机器学习算法原理
1.线性回归自变量与因变量是一种线性关系。y=wx+by=w1x1+w2x2+……wnxn+w0x0此处用w0x0代表b,w0=b,x0=1。损失函数为1/2(yi-y^)^2。即预测值与实际值之差的平方和最小。预测值均值与实际值均值相等一元线性回归的系数为:多元线性回归:系数为:2.逻辑回归逻辑回归不是回归问题,它解决的是分类问题。使用sigmoid函数可以让数据从负无穷到无穷变化为(0,1)因此可以将其转化为概率正例sigmoid(z)>0.5负例sigmoid
2020-09-16 22:02:24
3559
原创 统计分析基础
1.描述性统计分析1. 统计量频数、频率均值、中位数、众数、分位数极差、方差、标准差偏度(skew)小于0左偏,大于0右偏(右尾长)峰度(kurt)小于0低于正态分布,大于0高于正态分布正态分布均值=中位数=众数左偏(偏度skew<0)均值<中位数<众数右偏(偏度>0)均值>中位数>众数分位数如果不为整数则按权重取值2.变量类型类别变量:无序类别变量(名义变量)有序类别变量(等级变量)数值变量:连续变量离散变量2.参数估计1.点
2020-09-10 21:49:47
2430
原创 Pandas基础
1.Pandas简介Pandas基于NumPy的一种工具,纳入了大量库和一些标准的数据模型。Pandas基于两种数据类型:Series与dataframe2.Series对象Series类似一维数组,Series可以自定义标签,也就是索引(index)。import pandas as pdfrom pandas import Series,Dataframeimport numpy...
2020-09-10 20:49:27
163
原创 mysql数据库基础建库与建表
数据库基础#新建数据库create database name; #有分号,name为数据库名,不能重名,首字母不能为数字和$。create database name charset utf8mb4 clooate utf8mb4_general_ci#查询和选择数据库show databases; use name;#删除数据库drop databases name;表的基...
2020-09-10 19:59:34
574
1
原创 NumPy简介及使用
NumPy1.NumPy的优势NumPy是一个开源Python科学计算库,用于快速处理任意维度的数组。对于同样的数值计算任务,使用NumPy比直接使用Python要简洁、快速。NumPy中的数组的存储效率和输入输出性能远优于Python中等价的基本数据结构,其能提升的性能与数组中的元素成正比。NumPy大部分代码使用C语言写的,在底层算法在设计时就有优异的性能,这使得NumPy比纯P...
2020-09-09 20:55:20
464
原创 Python面向对象
面向对象编程面向对象编程——Object Oriented Programming,把对象作为程序的基本单元,一个对象包含了数据和数据操作的函数。面向过程的程序设计把计算机程序视为一系列的命令集合,即一组函数的顺序执行。(C语言)面向对象的程序设计把计算机程序视为一组对象的集合,每个对象都可以接收其他对象发过来的消息,并处理这些消息,计算机程序的执行就是一系列消息在各个对象之间的传递。Py...
2020-09-09 20:45:31
180
原创 sql基础语法与常用函数
1.基础语法1.select …A… from …B… where …C…A:列名B:表明C:筛选条件如果该表是一个分区表,则where条件中必须对分区字段进行限制。2.group by … having3.常用聚合函数1.count():计数 count(distinct … …)去重计数2.sum():求和3.avg():平均值4.max():最大值5.min():最...
2020-09-09 20:44:25
368
原创 Python函数的定义与调用
函数定义def 函数名(): 代码通过help(函数名)可以查看函数相关说明函数的参数1.位置参数按照对应的位置顺序传参2.默认参数当调用函数时为对默认参数传参,则默认参数为定义的默认值**(必须为不变对象,如str、None)**默认参数降低了函数调用的难度。当有多个默认参数可以按顺序输入,当不按顺序时需要将参数名写上。def power(x,n=2,m=3)#n=2,...
2020-09-09 18:58:52
204
原创 Python字符串、列表、元组、字典和集合的常见操作
一、字符串(str)常见操作1.find检测str是否包含在mystr中,如果是返回开始的索引值,否则返回-1。index与find使用相同,只是在找不到时会报错。rfind、rindex从右边开始找。mystr.find(str,start=0,end=len(mystr))2.count返回str在start和end之间在mystr里出现的次数mystr.count(str,st...
2020-09-09 18:55:39
349
原创 Python异常处理与文件打开
异常处理捕获异常#将可能出错的部分用try运行#当执行出错,后面代码不会继续执行,转到错误处理代码即except,执行相应错误处理#如果没有错误则会执行else,最后不论什么情况finally一定执行try: print('try...') r=10/int('a') print('result',r)#错误处理也是class,当执行父类的时候也会包含它的子类#即xecept ...
2020-09-09 18:55:00
514
原创 Git初步操作
1.创建版本库repository在指定目录下git init将文件放入该目录版本控制系统只能追踪文本文件的改动,如txt。对于二进制文件没法追踪文件的变化。如果要真正使用版本控制系统需要使用纯文本形式编写文件。由于word采用二进制格式,所以无法追踪文件的改动,而windows记事本在每个文件开头添加了0xefbbbf(十六进制)的字符,所以会有很多问题建议使用Notepad++,...
2020-09-09 18:54:43
116
原创 MySQL常见面试题
1.语法1.如何查看一个已经建好的表结构与建表参数查看表结构 desc tablename;查看建表语句 show create table tablename;2.char和varchar有什么区别,varchar(255)和varchar(256)有什么区别char(n)的字段长度是固定的 varchar(n)的字段长度是可变的char(5) 输入:abc 存储:ab...
2020-09-09 18:54:12
270
原创 购物表查询分析
1.表内容user_info列名数据类型示例user_idstring101(唯一值)user_namestringNick(唯一值)sexstring[male,female]ageint20citystringbeijingfirstactivetimestring(2017-05-03 12:40:28)l...
2020-03-26 22:06:28
996
原创 对google play store app的数据分析与实用的报表生成
1. 对google play store的app数据分析import numpy as npimport pandas as pdimport matplotlib.pyplot as plt#Genres内容分级
2020-03-22 16:05:30
1471
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人