- 博客(73)
- 资源 (3)
- 收藏
- 关注

原创 ”六边形战士”雷达图原来是这样画出来的
"六边形战士"雷达图是怎样画出来的大家认识这张图吧! 图片来源于网络乒乓球大佬马龙无论是从力量、速度、技巧、发球、防守、经验六个方面都是边框撑爆,不得不说,在日本乒乓球选手面前马龙就是神一样的存在啊,就像游戏里面的大Boss一样的又很又慕啊!那么,大家知道这这样的雷达图是怎样的生成出来的吗?实际上,想生成这样的图是很简单的。而且我们可以借用很多工具来实现。比如我们前面用来生成疫情地图的Tabl
2021-10-30 09:30:55
8251
1
原创 耗时三个月,用flask写了一个带推荐系统的旅游社交平台
一个用Python的Flask为框架开发的旅游社交平台,可以为毕设作参考,平台包含推荐系统、搜索、景点定位、评论等功能,希望能对你有帮助,源码请关注同名工重号回复【旅游】获取!
2022-09-16 22:44:04
935
1
原创 当你无心学习,试一试跑步和听音乐
1.并不是所有东西都是常识作为一个“程序员”,我有一次有趣的经历。一次,由于部门负责人叫我测试RPA(中文名自动化办公机器人),其实也就是因为项目可能需要用到这个自动化办公机器人,所以叫我试用而已。然后需要用到一个台式机安装这软件专门进行RPA的测试,当时主机有了,但是我工位没有显示屏,当天申请,需要第二天才能找行政领显示屏,我问了运维的大哥一个比较“傻”的问题,我说:“笔记本电脑可以用来做主机的显示屏吗?”可能这个真是算是一个计算机从事者的“常识”吧。运维大哥说,第一,想要用笔记本连接主机,只有将笔记
2022-05-22 15:00:46
178
原创 分享一次RPA---影刀对手机自动化操作的探索
之前用过影刀进行爬虫,以为这玩意儿只能用来爬虫,知道工作后和自动化接触,才知道这玩意原来是RPA,官方叫RPA机器人,所谓RPA,在我看来就是在代码的基础上更上一个层次的进行的自动化实现工具,实际上也就是实现每个功能的代码封装起来作为一个“组件”,我们需要完成一个自动化项目时,可以根据需要组合这些组件,组成流程,最后运行完整的流程就可以实现自动化操作。 这实际上也与使用代码进行自动化实现的思路类似,区别是写代码更灵活,更能够根据需求进行自动化脚本的开发,而使用RPA实现自动化的灵活性会差一些(当然R
2022-05-08 02:09:51
7111
3
原创 有了这个Python程序后,干完饭不用再花时间算账了
大家好,我是翔宇!今天带大家实现一个算账自动化,由于疫情,公司员工吃饭等着食堂送到工位,然后由我来帮大家订餐,每个周五由我来算账,再收大家的饭钱。文章目录1.导入数据2.采用pandas处理数据2.1类似excel中的分列处理2.2采用正则表达式处理2.3每次取两列与“主表”进行左外连接3.算账3.1将NAN值全部处理成03.2建立映射,计算“总计”列4.保存结果连续几周后,由于每次我算账用excel来算,所以,每次都要将信息统计在excel里面进行整理再计算,每次都可能花费10分钟以上,而且对于我们
2022-03-12 15:21:38
7164
6
原创 简单的python项目fastapi在云服务器的部署
fastapi在云服务器的部署最近在学习fastapi,但是在本地运行确实很不过瘾,所以买了一个阿里云服务器,今天终于让代码在云服务器上跑起来了。1.从gitee上将代码克隆下来git clone --depth [url]2.安装虚拟环境切换到对应路径:cd /root/fastapi/安装virtualenvpip3 install virtualenv 安装虚拟环境virtualenv --python=$(which python) venv3.激活虚拟环境. ve
2022-02-16 22:42:22
2778
2
原创 用pycham,你还在单个安装项目依赖库?
大家好,我是翔宇!今天,我带大家写点笔记,这个小技巧,可能pythonic们都用得很习惯了,觉得是再常识不过的东西了,它就是项目依赖项的生成和依赖项的安装。那么既然大家都会,我还要总结一下呢?Python新手们可不一定都会哦!前几天,看见一个学弟在用pycham时,在创建了一个项目之后,在创建虚拟环境时,他就直接自然的使用了全局的python解释器,我问他,你为什么要使用全局的虚拟环境,而不单独创建一个新的python虚拟环境呢?他反问道:这个东西还有什么讲究不成?创建一个新项目大家不都是直接这样创建的
2022-01-09 01:57:36
1817
2
原创 数据分析 | 全距和四分位距分别是什么
大家好,我是翔宇!不知道全距这个最基本的含义你是否知道,那么它能给我们提供什么信息呢?我们知道,在描述数据时,我们通常会采用均值或众数又或中位数来简单描述一组数据,但是,我们发现,不管是你用均值、众数亦或是中位数,我们只能告诉别人这组数据的核心数据,而想要描述数据的分布情况单纯用这几个概念却遇到了问题。于是,有人提出了用全距来描述数据的分布情况。一、全距全距的含义和计算如果你还没有上过统计学相关的课程,有可能你听全距这个词会以为是什么高大上的东西,但是,没想到的是,它竟然就是我们高中学过的极差。大家
2021-12-01 23:22:27
4784
1
原创 什么是波士顿矩阵
大家好,我是翔宇!这期我们来聊聊波士顿矩阵。不管你听过没听过什么叫波士顿矩阵,反正你要知道它很厉害就对了,厉害在什么地方呢?波士顿矩阵(BCG Matrix),又称“市场增长率-相对市场份额”矩阵,它由美国著名的管理学家、波士顿咨询公司创始人 布鲁斯·D·亨德森 于1970年在 “明星、瘦狗、金牛和问号矩阵” 一文首次提出。通常在商业的应用是用在产品分析方面。例如,一般来说,我们每一个公司一般都是有很多种产品,那么每种产品在市场所受欢迎的程度肯定都是不同的,那么,请问我们对于每一类产品真的都要投入相同的
2021-11-21 15:33:03
8409
原创 怎样通俗易懂理解Bagging和随机森林
大家好,我是翔宇!今天我想和大家聊一聊什么是机器学习中的Bagging思想和随机森林。由于代码实现比较复杂,因此,我没有准备现在进行代码展示,可能后续会有,当然我这里说的代码实现不是指掉包使用,掉包使用很简单,这个分享留在后面一点发,今天我只和大家分享Bagging的思想与随机森林的设计思想。 首先我们先来讲一点预备知识,机器学习有很多进行分类和回归的预测方法(模型),而例如分类的KNN、逻辑回归与进行回归的线性回归以及可以做回归也可以做分类的CART等都是一个比较单一的模型。而为了使得模型的泛化性能
2021-11-20 17:40:45
898
原创 一个部门1/2为系统工程师,2/5为软件工程师,1/4两者都是,那么两者都不是的比例为
大家好,我是翔宇!今天我想和大家分享这样一道数据分析面试题,是一道考验是否具备基本逻辑思维能力的题目。这道题目是之前在面试数据分析岗位的时候遇到的。刚好今天没什么写作的灵感。就想到把这道题目给大家分享一下。题目题目描述:一个部门1/2为系统工程师,2/5为软件工程师,1/4两者都是,那么两者都不是的比例为?一开始看到这道题目时,还有些懵的,因为那时候基本一直做的题目都是关于Python、SQL、数据分析相关的练习,也没想到练练这种题。但是,后面分析了一下,觉得不仅不难,还挺有趣的。难度的话算个中
2021-11-15 14:42:32
2393
1
原创 数据分析 一文搞懂什么是RFM模型
数据分析 | 一文搞懂什么是RFM模型想知道你在电商平台心里的地位吗?学会RFM分析法,你自然知道大家好,我是翔宇!今天我们来了解做数据分析一定要会的分析方法之一----RFM分析法。相信大家在前天的双十一一定也多多少少贡献了自己的力量了吧!剁手然后吃土,那么你是否思考过你在眼里是上帝还是可有可无?基于这个问题,今天我特意来和大家聊聊RFM模型,了解RFM模型之后,上面的问题将迎刃而解。如果我直接将RMF的原理及实现,我怕各位立马划走,所以,我们先来看看有趣的场景,再根据此场景逐步剖析RFM。
2021-11-13 15:43:09
5399
2
原创 Python中机器学习模型的几种保存方式
Python进行机器学习的几种模型保存方式!大家好,我是翔宇!今天我给大家分享机器学习模型的几种保存方式!大家都知道,在我们做数据分析的时候,不仅需要掌握业务,对业务指标进行监控等,而且在有些时候我们需要掌握一些数据挖掘的方法来满足一些“特殊”的工作需要。这就经常用到机器学习的模型进行分类、回归等。那么,很多时候我们都是将重点放在模型的算法、效果上,很少有人在乎当我们训练出一个模型后,如果我们需要将其保存下来,以便任何需要的时候都可以拿出来使用。因此,今天我特意分享一下,在Python中,如果我们想要完
2021-11-11 00:06:31
20028
2
原创 Python中的range函数
大家好,我是翔宇!今天我们聊聊Python中很重要的range对象!(本文章基于Python3环境,Python2环境下的range会有所不同,但并不影响我们使)range对象1.range对象是什么每一个Python初学者都一定在开始学Python不久就一定会遇到”range函数“,大家都把他叫做“range函数”,是因为我们在用它的时候像调用函数一样,只需要给它传入参数,它就可以给出你想要的结果。这一点和函数是一样的,于是大家就习惯上把它叫做函数。但其实它并不是一个函数,因为它是惰性的,什么叫惰性
2021-11-09 23:59:33
91203
4
原创 Excel合并多张表
大家好,我是翔宇!在工作中我们经常遇到这样一个问题。将多个张表汇总到一张总表里面,如果你还没有上班,那么如果是是班上的班干,那么我相信你对这样的工作也是深有体会吧!如果你既不是上班族,大学里也是那个四年老师叫不出名字的同学,那么,缘分刚刚好,我要找的就是你。相信我,如果你现在还不会这一招,工作之后它一定会给你带来烦恼。下面我们就开始演示如何汇总多张表的数据。可能对于很多人来说,如果表的张数不多,当然,复制粘贴yyds,但是如果我们的表太多了呢?不如需要汇总100张表,C/V不仅效率低,并且很容易出错。
2021-11-08 00:36:56
522
原创 必会技能:如何在Python中连接数据库获取数据
必会技能:如何在Python中连接数据库获取数据大家好,我是翔宇!想要成为一名数据分析师,一个最基础的技能就是:提取数据。数据是数据分析的基础。因此,掌握各种获取数据的技能一定是一个合格的数据分析师的必备技能。而我们的需要进行提取的数据通常是存储在数据库中(当然,也有不存储在数据库中的,这里不是探讨重点)。而现在随着python语言的流行,加上Python强大的三方库和生态圈几乎让数据分析师完成整个数据分析工作,Python几乎成为了每一个数据分析师必会编程语言。自然,python有许多三方库能够连
2021-11-07 23:54:52
21238
1
原创 python中如何忽略警告?(代码)
python中如何忽略警告?代码import warningswarnings.filterwarnings("ignore")运行后此代码后再运行报警告的代码,发现没有一堆警告了!
2021-11-06 10:49:10
1161
原创 模型评估,混淆矩阵到底是个什么东东?
混淆矩阵到底是个什么东东?大家如果学过机器学习的知识,应该见过这样一个东西就是这样一个东西,用处可大了。现在我们一起探索这个框框的具体含义(仅在机器学习使用方面)。1.预备知识分类模型的评估请大家回想一下,我们在做分类模型时,通常想要评定一个模型好不好的是怎样评定的呢?通常我们采用模型的准确率来评定一个模型的好坏。也就是说,例如我们现在训练了一个分类模型,现在有100个测试样本等待测试,用模型进行分类测试后发现这个模型测试正确了98个(测试正确的意思即是模型预测出的标签和真实标签相同)。现在,我
2021-11-01 14:39:54
1035
原创 以最易懂的人话讲分类和聚类算法(建议分享和收藏)
以最易懂的人话讲分类和聚类算法(建议分享)今天在使用聚类方法进行客户价值分析时遇到了个问题,将我卡住了半个小时,实际上现在想来是一个很简单的问题,但是大家都知道,一个人脑子短路时就是会一个小学数学题也做不出来。但是虽然简单,在知乎或者是csdn上我也没有找到合适的答案,后面正在我想放弃自己挣扎放下面子问同事时,突然就灯泡就亮了。于是我决定要和大家分享一下。我做的是一个将客户按照价值分成几个群体的简单任务,需要将客户分成几个群体后画出下面这样的雷达图,然后进行分析我们先来分析一下这样的图怎样做,雷
2021-10-24 14:00:05
2646
原创 pandas创建DataFrame的几种方式(建议收藏)
pandas创建DataFrame的几种方式如果你是一个pandas初学者,那么不知道你会不会像我一样。在学用列表或者数组创建DataFrame时理不清怎样用数据生成以及想要形状的的Dataframe,那么,现在,你不用自己琢磨了,我这里给你整理了一下,现在我们就来看看这三种生成Dataframe的方式。1.用传入列表或者数组创建DataFrame采用列表创建DataFramenums = [[i for i in range(3)] for _ in range(10)]numscol
2021-09-30 00:21:45
40257
3
原创 python计算中奖问题的概率
题目:抽奖中,宝箱中奖概率是20%,抽5个能不能保证100%中奖?很显然,只要样本不是小于等于5个,那自然不能保证了下面,我们用python来模拟一下这个抽奖的过程,这里用统计频率代替概率import randomp = 0.2 # 其实没用到这个变量# 产生一个100万个元素,且有80万个0,20万个1的列表,# 0代表没中奖,1代表中奖lis=[0 for _ in range(800000)]+[1 for _ in range(200000)]# 将这里元素打乱位置random.s
2021-09-28 19:23:32
1920
原创 matplotlib数据可视化之箱线图
matlablib数据可视化之箱线图(盒须图)要想了解箱线图,我们从以下几个问题探讨的角度来了解它箱线图长什么样?箱线图可以做什么?箱线图怎么画以及异常点怎么找?第一个问题:箱线图长什么样?直接上图它就长这样,中间一个箱子,加上中间一条线贯穿,因此形象的被人们称为箱线图,那么看看中间想不想一个盒子,上下两边像不像两根“胡须”呢?其实它还被人们形象的称为盒须图那么第二个问题:这样的图有有什么用?相信你已经发现了,用这样一个箱线图,我们能够直观的看出数据的各个描述性统计信息分别大致在什么
2021-09-25 18:30:13
1893
原创 python电商数据预处理
电商数据预处理今天对电商数据进行了预处理,主要处理了1. 提取2019年的订单数据2. 处理业务流程不符的数据(支付时间早于下单时间、支付时长超过30分钟、订单金额小于0、支付金额小于0)3. 处理渠道为空的数据(补充众数)4. 处理平台类型字段(去掉多余的空格,保持数据一致)5. 添加折扣字段,处理折扣大于1的字段(将支付金额修改为“订单金额*平均折扣”)数据在这里,有兴趣跟我一起做。(百度网盘)链接:https://pan.baidu.com/s/1yprZr0sxzLLPPBy-I
2021-09-25 00:57:45
1798
2
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人