
数据分析
destiny_python
目前正从事数据分析工作,并在不断精进中
展开
-
批量修改文件名,把文件名中的汉字自动替换成其首字母
在平时的工作中,当我们面对几百上千的文件时,想要按照某一规则修改其文件名,手动改肯定不人性化,下面这个程序可以根据工作者需要,稍作修改,可以完成不同要求的文件名批量修改任务,本博文是在笔者工作过程中遇到这样的需求写的,本博文实现的主要功能是把文件名中的汉字自动替换成其首字母,其他不变。如果有其他要求,把代码稍作修改,相信也可以实现。如图:原创 2017-03-24 09:22:54 · 8239 阅读 · 4 评论 -
python 把一个m*n的二维矩阵转换成一个m*n行,三列的列表
在数据处理的时候,我们经常遇到需要把一个矩阵,转换成列表,如下的矩阵转换成列表: 80080180211891163.5691163.5691163.56911901163.5841163.5841163.58411911163.6351163.6351163.6351192原创 2017-02-28 10:34:15 · 12689 阅读 · 4 评论 -
选择一个文件夹下所有txt文件的几列数据
有时我们会遇到这样的业务需求,比如我们有很多数据文件,里面有很多数据项,一列表示一个数据项,并且不同文件数据项的排列顺序也是随机的。但是我们只需用到其中的几列数据,并且我们需要我们用到的几列数据按照既定的顺序排列,如下图:这是一个txt文件,里面有9列,但是我只需要其中的DEPTH,AZIM,DEV三列,对于这样的需求,如果有几百个这样的文件,就必须编程来实现了,下面是源代码:impo原创 2017-03-28 13:56:28 · 5453 阅读 · 3 评论 -
用python实现排列组合
比如我们要实现1,2,3的排列组合,我们可以很容易写出来,如下表: 1个元素2个元素3个元素不考虑顺序1231,2,312,13,23123考虑顺序1231,2,3,12,21,13,31,23,32123,132,213,231,312,321用代码实现,首先是不考虑顺序的:#选取2原创 2017-08-21 22:51:09 · 62413 阅读 · 4 评论 -
两个文件,按照一个文件中的某一列筛选另一个文件中的数据
当我们手头有两个文件,一个文件很大,有很多很多行,而另一个文件比较小,现在我们需要根据两个文件的一个公共列,取出大文件中同时出现在两个文件中的那些行的所有数据。数据解释如下:文件A:文件B:我想从文件A中取出“汉字井号”分别为“孤东7-27更5186”、“孤东7-23斜更186”、“孤东7-6平1”这几行的资料。代码如下# -*- coding: utf-8 -*-"原创 2017-11-29 11:40:35 · 18478 阅读 · 5 评论 -
用pandas按列合并两个文件
直接上图,图文并茂,相信你很快就知道要干什么。A文件:B文件:可以发现,A文件中“汉字井号”这一列和B文件中“WELL”这一列的属性相同,以这一列为主键,把B文件中“TIME”这一列数据添加到A文件中,如果B文件中,则空着,最后A文件的行数不变,效果如下:代码如下:# -*- coding: utf-8 -*-"""Created on Wed Nov 29 1原创 2017-11-29 16:34:31 · 12490 阅读 · 3 评论 -
用pandas里的groupby函数实现把一个大文件按某一列的类型分成多个文件
上图说话,浅显易懂大文件:可以发现上图“单元这一行”有三个不同的值,我想以这一列为主键,分成三个文件,文件名以主键内容命名,输入如下图:对于GO7-33-286.csv、GO7-35-226.csv、GO7-37-166.csv这三个文件内容,分别如下:实现代码如下:# -*- coding: utf-8 -*-"""Created on Thu Nov 30原创 2017-11-30 11:20:22 · 7275 阅读 · 7 评论 -
pandas按若干个列的组合条件筛选数据
还是用图说话A文件:比如,我想筛选出“设计井别”、“投产井别”、“目前井别”三列数据都相等的数据,结果如下:当然,这里的筛选条件可以根据用户需要自由调整,代码如下:# -*- coding: utf-8 -*-"""Created on Wed Nov 29 10:46:31 2017@author: wq"""import pandas as pd#in原创 2017-11-30 13:27:57 · 95165 阅读 · 4 评论