- 博客(34)
- 资源 (1)
- 问答 (1)
- 收藏
- 关注
原创 关于机器学习中的特征共程
在机器学习的模型训练中,特征工程是非常重要的环节,虽然很多机器学习的相关书籍都把重要的篇幅放在了算法上,但是在实际的应用中,特征工程是非常重要的环节,甚至可以说是决定模型结果的关键。关于特征工程有一下几个问题需要搞清楚:1,为什么要进行特征工程 2,进行特征工程的方法有哪些。1,为什么要进行特征工程以非常经典的房价预测为例,影响房价的因素有很多,原始的数据集大约有几十个特征,那么我们这些特征我...
2020-05-07 15:01:40
239
2
转载 转载一些好的文章
1,一篇关于支持向量机的文章:零基础学SVM—Support Vector Machine(一) - 耳东陈的文章 - 知乎https://zhuanlan.zhihu.com/p/24638007
2020-05-07 10:43:22
209
原创 pythongithub文档
https://github.com/fendouai/PyTorchDocs/blob/master/ThirdSection/LearningPyTorch.md
2020-04-21 18:08:11
209
转载 dataframe改变列的顺序
内容方法一:最简洁的方法order = ['date', 'time', 'open', 'high', 'low', 'close', 'volumefrom', 'volumeto']df = df[order]12比如说,这里,就可以之保证列的顺序是按照这样的排序的。总之,就是给一个list。方法二:查询自下面的链接。https://blog.csdn.net/u012...
2019-03-20 15:51:12
8353
2
原创 pandas 的空值处理
1,如果用pandas读取了csv文件中的数据train = pd.read_csv(r'd:\user\01378237\桌面\件量预测\产品占比预测.csv',header=0,engine='python')其中会有一些缺失值,以NAN表示,可以作如下处理:if pd.isnull(train.iloc[i, j + 1]) is True: train.iloc[i, j +...
2019-03-15 12:40:19
923
转载 怎么用CMD命令进入D盘
其实这不叫cmd命令,而是在运行中输入cmd进入DOS界面。输入的命令叫做DOS命令。DOS进入D盘是个很基本的操作。你可以运用DOS命令对磁盘进行访问,修改等一系列的操作。首先按win+R,可以让你很快地打开运行窗口;在运行窗口输入cmd进入DOS界面后;输入cd\ 然后按回车键 ,你会发现指示符变成了C:> 。然后在这行输入d: 再次按回车键确定,你就完美的进入D盘了,至于后面你想...
2019-01-17 09:33:16
17788
2
原创 python处理图片格式的数据
import pandas as pdimport numpy as npimport PILfrom PIL import Imagefile = (r'd:\user\01378237\桌面\river.jpg')img = Image.open(file,mode='r')box = (10,10,500,500)region = img.crop(box)region.sa...
2019-01-08 16:07:33
540
原创 Pycharm常用快捷键
快速查看库源码 Ctrl+B快速换行 Ctrl+enter切分窗口 Shift+A快速展开和合并函数 Ctrl+shift++和 Ctrl+shift±快速注释 Ctrl+/超级搜索 双击Shift最近访问过的文件 Ctrl+E历史粘贴板 Ctrl + Shift + V替换 Ctrl+R对已有的代码进行操作 Ctrl...
2018-12-24 09:43:25
153
转载 python编程总结
1,在python当中一切皆对象,每产生一个对象会对应三个属性:id、类型type和数值2,创建一个类就会创建一个类的名称空间,用来存储类中定义的所有名字,这些名字称为类的属性:而类中有两种属性:数据属性和函数属性,其中类的数据属性是共享给所有对象的,而类的函数属性是绑定到所有对象的。 3,在类的内部来说,__init__是类的函数属性,但是对于对象来说,就是绑定方法。4,命名空间的问题:先...
2018-12-18 18:17:58
576
转载 python print输出后面为什么会跟一个None
因为python中print函数需要返回值,如果你在print函数中所放的函数没有返回值,那么print将会return None
2018-12-15 11:25:17
3223
转载 python寻找list中最大值、最小值并返回其所在位置
c = [-10,-5,0,5,3,10,15,-20,25]print c.index(min©) # 返回最小值print c.index(max©) # 返回最大值
2018-11-27 10:28:03
7037
转载 方差为什么除以
设样本均值为,样本方差为,总体均值为,总体方差为,那么样本方差有如下公式:很多人可能都会有疑问,为什么要除以n-1,而不是n,但是翻阅资料,发现很多都是交代到,如果除以n,对样本方差的估计不是无偏估计,比总体方差要小,要想是无偏估计就要调小分母,所以除以n-1,那么问题来了,为什么不是除以n-2、n-3等等。所以在这里彻底总结一下,首先交代一下无偏估计。无偏估计以例子来说明,假如你想知道一所...
2018-11-19 17:50:33
858
原创 Python中一些非常好用的函数
1,Counter 函数from collections import Countera=Counter('jfdhuhweurhfsjknvfiauwrfhawfjawufh')print(a)Counter({'f': 6, 'h': 5, 'u': 4, 'w': 4, 'j': 3, 'a': 3, 'r': 2, 'd': 1, 'e': 1, 's': 1, 'k': 1, '...
2018-11-19 17:49:44
202
原创 ppt制作心得
1,每一页ppt都要有题目,简要概括本页ppt的内容,建议深青色(个性色1),黑体标题,加粗2,正文建议灰色(非常类似于黑色),黑体正文。3,另外,需要醒目标记的建议粉红色,淡色40%,例如,图标标题等...
2018-11-13 11:16:20
886
原创 python书写的一些技巧
1,with可以在写入文件后自动将文件关闭`with open ('text.txt.', 'w') as f: f.write('test')比f=open('text.txt','w') f.write('test')要好2,format 比 % 要好
2018-11-06 17:47:22
181
转载 xlwt写入excel数据
import xlwtworkbook = xlwt.Workbook()sheet1=workbook.add_sheet(‘test’,cell_overwrite_ok=True)#生成sheet:test,如下图1:data = {“1”:[u"张三",150,120,100],“2”:[“wang”,90,99,95],“3”:[“wu”,60,66,68]}num =...
2018-11-05 15:03:03
2330
原创 pandas处理csv格式的数据
import pandas as pdimport numpy as npfrom pylab import *mpl.rcParams['font.sans-serif'] = ['SimHei']mpl.rcParams['axes.unicode_minus'] = Falsefile_path='D:\算法比赛\件量数据试验.csv'data_csv=pd.read_csv...
2018-10-30 18:30:48
354
原创 python写入excel文件
关于python如何写入excel,网上的资料很多,一般会用xlwt模块,但该模块对于处理xls格式的文件很好,但对于xlsx的文件则会出问题。现在的excel大部分都是xlsx格式,所以我还是推荐大家用xlsxwriter模块。模块的安装很容易,不多讲,下面给出一段示例代码def data_write(file_path, datas): f = xlsxwriter.Workboo...
2018-10-29 19:22:55
970
转载 python写入其它格式的文件
def text_save(filename, data):#filename为写入CSV文件的路径,data为要写入数据列表. file = open(filename,'a') for i in range(len(data)): s = str(data[i]).replace('[','').replace(']','')#去除[],这两行按数据不同,可以...
2018-10-29 18:05:46
496
原创 关于map函数
今天遇到的一个问题是如何将一串列表中的字符串型数字转化成数值型,可以用map函数`y=['1','2','3']w=map(lambda x:int(x),y)w=[1,2,3]
2018-10-25 18:09:05
172
原创 R做kmeans聚类和画图
library(xlsx)library(kmeans)data<-read.xlsx2('D://数据//分时率.xlsx',1,header=TRUE)clur<-kmeans(x=data,centers = 6,nstart = 500)clur$size #每一类的数量clur$centers #浏览每个类的中心time<-c(1,2,3,4,5,6,...
2018-10-23 17:17:43
9941
原创 画图小技巧
y=[y1,y2,y3,y4,y5,y6,y7,y8,y9,y10]color=['blue','red','black','red','orange','skyblue','pink','yellow','peru','purple']label=['0,55','1,13','2,26','3,55','4,12','5,21','6,44','7,43','8,1','9,62']pr...
2018-10-23 14:48:38
154
原创 一些读excel和画图的技巧
import xlrdpath='D:\全国.xlsx'data=xlrd.open_workbook(path)sheet=data.sheet_by_name('Sheet1')i=1dict1={}dict2={}city=[]while True: try: c=sheet.cell_value(i,0) city.append(...
2018-10-22 16:38:24
358
转载 K-means经典代码
import pandas as pdfrom sklearn.cluster import KMeans #导入K均值聚类算法import matplotlib.pyplot as pltinputfile = '../zscoreddata.xlsx' #待聚类的数据文件outputfile = '../fenlei.xlsx'k = 5 ...
2018-10-22 15:52:20
231
原创 安装Scrapy库
最近研究爬虫需要装scrapy库,在anaconda环境下装总是报错,这时候要注意在anaconda命令行下用conda install scrapy 装就可以了,会自动的寻找安装环境,安装在指定目录下。...
2018-10-16 11:31:54
357
转载 *args和**kwargs
今天看源码的时候发现一个是*args和**kwargs,一看就能知道args是神马,就是所有参数的数组,kwargs就不知道了,google一下,一个人的blog写的比较简单明了,秒懂了~~kwargs就是当你传入key=value是存储的字典。补充一下:kwargs不影响参数位置例子:def test(a,*args,**kwargs):print a#print b#print c...
2018-10-15 15:09:09
93
转载 substring函数
SQL 中的 substring 函数是用来抓出一个栏位资料中的其中一部分。这个函数的名称在不同的资料库中不完全一样:MySQL: SUBSTR( ), SUBSTRING( )Oracle: SUBSTR( )SQL Server: SUBSTRING( )最常用到的方式如下 (在这里我们用 SUBSTR( ) 为例):SUBSTR (str, pos)由 中,选出所有从第 位置...
2018-10-15 10:48:30
1516
1
原创 滑动窗口
以leetcode里的一道题为例介绍滑动窗口方法209.长度最小的子数组给定一个含有 n 个正整数的数组和一个正整数 s ,找出该数组中满足其和≥ s的长度最小的子数组。如果不存在符合条件的子数组,返回 0。示例:[2, 3, 1, 2, 4, 3], s = 7结果2。[4, 3]是长度最小的问题分析:按照上题的思路进行如下分析,结合下面的代码部分,我将每一部分的名字都标注在代码...
2018-10-15 09:37:40
256
原创 gurobi安装和使用心得
最近领了一个任务是用一下gurobi,因为我们组以前只用cplex,最近在考虑要不要买gurobi的权限,所以要我先试用一下。 安装下载页确实费了一番功夫,因为公司网的原因,始终无法下载成功,最后还是找其他组的同事要了一个安装包才成功装上。装上之后需要有licence,因为在企业的网,不是校园网,所以网上申请的学术版Licence其实不能用。好在我联系了gurobi中国区的代理公司,他...
2018-09-21 11:38:50
14293
8
Practical and Efficient SAS® Programming The Insider's Guide.pdf
2020-06-02
pandas读取excel的中文列名时出现错误
2019-11-19
TA创建的收藏夹 TA关注的收藏夹
TA关注的人