- 博客(26)
- 收藏
- 关注
原创 数据分析实战1(Excel制作报表)
任务——成果——过程——问题——建议熟悉报表,复现操作,确保可以完成下个月的数据处理5月报表复现完成,所有操作均已了解熟悉数据-复现操作-思考迭代为啥公司不看图,都是数呢?我想尝试优化线报表,升级为仪表盘增加更多直观的可视化,提高分析效率!取消合并——定位空值——输入“=上一单元格”——ctrl+enter填充内容。
2025-05-27 15:19:53
533
原创 Sql刷题日志(day9)
随机森林(Random Forest)是一种集成学习算法,通过训练多个决策树并结合它们的预测结果来提高预测的准确性。随机森林的基本原理构建多个决策树,每个决策树的特征和样本是随机选择的。在预测时,多个决策树的预测结果进行投票,选出出现次数最多的结果作为最终的预测结果。随机森林的优点包括:可以处理高维数据和非线性关系;可以通过特征重要性评估方法获取特征的重要程度,帮助进行特征选择和数据可视化;可以防止过拟合和提高模型的泛化能力。随机森林的缺点包括:训练速度较慢;
2025-05-20 21:15:23
1057
原创 Sql刷题日志(day8)
AB测试可以在多种平台上进行,包括专业的AB测试平台如GrowthBook、火山引擎 A/B 测试平台、神策数据等,以及一些开源工具。步骤参考day7概念:A/B测试是建立在假设检验的基础上,通过单变量控制法,常用来检验新版本和旧版本之间是否存在显著性差异,是提升业务最有效、最实用的方法步骤:1.现状分析并建立假设,2.设定目标并制定方案,3.设计与开发,4.流量的分配,5.收集并分析数据,6.得出结果,确定最终是否上线新版本 样本量计算:功效分析样本量的计算是比较重要的内容,
2025-05-07 19:59:57
710
原创 Sql刷题日志(day7)
工作中,公司的数据获取途径主要有3个:企业数据库、线下数据和外部数据,外部数据一般是爬虫工程师爬取;数据的处理一般是通过编写SQL代码或者通过Kettle来处理,数据处理的流程包括:获取数据->筛选数据->清洗数据(包括去重、NUll值处理等)->数据统计(比如简单的聚合处理、描述统计等)P值:A/B测试是建立在假设检验的基础上的,P值就是在原假设成立的条件下样本所提供的证据对原假设的支持程度,P值越小对原假设拒绝的证据越多;第一类错误:即‘弃真’错误,就是原假设正确的情况下被判断为错误的概率;
2025-04-29 21:23:08
883
原创 Sql刷题日志(day6)
以信用评分卡模型为例,参与的流程有数据获取、数据预处理、探索性数据分析、变量选择、模型开发、模型评估、信用评分和系统建立。基本属性:包括了借款人当时的年龄。偿债能力:包括了借款人的月收入、负债比率。信用往来:两年内35-59天逾期次数、两年内60-89天逾期次数、两年内90天以上逾期次数。财产状况:包括了开放式信贷和贷款数量、不动产贷款或额度数量。贷款属性:商业贷款、公积金贷款。其他因素:包括了借款人的家属数量(不包括本人在内)。时间窗口:自变量的观察窗口为过去两年,因变量表现窗口为未来两年。
2025-04-28 20:56:47
848
原创 Sql刷题日志(day5)
先介绍项目背景:在xxx上线后,数据效果不明显,所以需要我们对其进行分析,找到原因。随后介绍分析思路:我们从xxx,xxx等角度进行分析xxx指标,得到xxx的现象。后说明分析结论和对应的解决策略。如果后续有继续观察策略落地的情况可以继续说策略落地后的效果。
2025-04-23 20:48:06
993
原创 Sql刷题日志(day4)
在公司的实习中,主要使用Tableau和公司的报表平台,我也能够熟练的使用这两项工具,对于不同的平台也有较快的上手能力。需要在回答中表现出自己的匹配能力,能够熟练使用数据分析工具,且对于陌生的工具有较快的上手能力。使用GROUP BY进行去重的方法和DISTINCT类似,仅需在查询语句末端增加GROUP BY即可,而且能够对分组数据进行筛选。在学校的学习中,主要使用Python和Excel产出可视化报表,所以我对这两项工具的使用也非常熟练。数据分析师需要接触不同的业务,在学习新的业务中,我们需要。
2025-04-22 20:20:17
864
原创 Sql刷题日志(day3)
Structured Query Language(结构化查询语句)。主要包括五类语言:查询语言DQL,操作语言DML,定义语言DDL,事务控制TCL,数据控制语言DCL。
2025-04-17 21:19:23
1099
原创 SQL刷题日志(day1)
2、row_number():窗口函数参数说明:4、date_format():格式化日期参数说明: 参数说明:参数说明:length(string):计算字符串字符长度replace(string,search,replace):在字符串中替换指定的子字符串
2025-04-14 21:32:07
378
原创 MySQL学习第14天(存储引擎、事务)
一个事务就是一个完整的业务逻辑。就是要完成一件事。什么是完整的业务逻辑?假设转账,从A账户向B账户转账10000。将A账户的钱减去10000(update语句)将B账户的钱加上10000(update语句)这就是完整的业务逻辑。以上的操作是一个最小的工作单元,要么同时成功,要么同时失败,不可再分。这两个update语句必须同时成功或者同时失败,这样才能保证钱是正确的。2、只有DML语句才有事务一说,其它语句和事务无关insertdeleteupdate。
2025-03-20 17:09:33
1170
原创 MySQL学习第12天(DDL语句)
create table 表名( 字段名1 数据类型, 字段名2 数据类型 ); 优点:节省空间。 缺点:动态分配空间,速度慢 优点:不需要动态分配空间,速度快 缺点:使用不当可能导致空间的浪费 varchar和char如何选择?( 性别字段选char;姓名选varchar) 数字中的整数型。等同于java的int 数字中的长整型。等同于
2025-03-17 19:06:23
1018
原创 MySQL学习第11天(34道习题:13-34)
13、面试题13、面试题有 3 个表 S(学生表),C(课程表),SC(学生选课表)S(SNO,SNAME)代表(学号,姓名)C(CNO,CNAME,CTEACHER)代表(课号,课名,教师)SC(SNO,CNO,SCGRADE)代表(学号,课号,成绩)问题:1,找出没选过“黎明”老师的所有学生姓名。思路:1、找出选过“黎明”的学生学号2、找出学号不在上面结果学号的学生。2,列出 2 门以上(含2 门)不及格学生姓名及平均成绩。思路:1、找出成绩不合格的大于2门的学生;
2025-03-16 16:05:33
646
原创 MySQL学习第10天(34道练习题:1-12)
思路:第一步:按照部门分组,找出最高薪资(作为新表t)新表t:第二步:表e和表t连接。连接条件:e.sal=t.max_sal and e.deptno=t.eptno第三步:合并。
2025-03-13 21:53:57
752
原创 MySQL学习第8天(连接查询)
distinct(原表数据不会被修改)——distinct放在所有字段前,对后续的所有字段联合起来进行去重eg:统计一下工作岗位的数量。
2025-03-11 13:56:28
932
原创 MySQL学习第7天(分组查询)
(计算每个部门的工资和?计算每个工作岗位的平均薪资?2、关键字顺序3、案例①找出每个工作岗位的工资和(先分组,再求和)顺序:从emp表中查询数据-按照job字段进行分组-对每组的数据进行sum(sal)②找出每个部门的最高薪资(思路:按照部门分组,再max(sal))③找出”每个部门,不同岗位“的最高工资(思路:先按照部门分组,再按照岗位分组,再求最高工资)技巧:两个字段联合成一个字段看④找出每个部门的最高薪资,要求显示最高薪资大于3000的思路:1、找出大于3000的薪资;
2025-03-06 22:54:06
301
原创 MySQL学习第六天(模糊查询、排序、单组处理函数)
找出名字中含有o的员工信息找出名字以T结尾的找出第二个字母是A的找出名字中有下划线的(\转义字符)
2025-03-05 21:10:17
460
原创 MySQL学习第五天(条件查询)
⑥between ... and(两个值之间,等同于>= and <=)——必须遵循。查询薪资在2450和3000之间的员工信息。查询工作岗位是manager,并且工资大于2500的员工信息。查询工作岗位是manager和salesman的员工。查询工作岗位是manager和saleman的员工。查询薪资小于等于3000的员工姓名和编号。查询薪资不等于800的员工姓名和编号。查询工资小于2000的员工姓名和编号。查询薪资大于3000的员工姓名和编号。查询薪资等于800的员工名字和编号。
2025-03-04 21:02:08
174
原创 MySQL学习第四天(常用命令、简单查询)
1、查询表数据2、查询表结构(不看表数据,只看结构)desc 表名;3、查看版本号4、查看当前使用的数据库;
2025-03-04 19:55:47
168
原创 Mysql学习第三天(MySQL Workbench 汉化教程)
找到 MySql Workbench 的安装目录,下面有个 data 目录,进入后可以看到里面存放了多个xml 文件,这些文件就是文本资源文件。点击下载,把文件 main_menu.xml 下载到本地,在从本地拷贝data_menu.xml文件到安装目录下的data文件夹中,替换掉data_menu.xml文件即可。退出Workbench,重新打开进入 Workbench 后,可以看到汉化完成!接下来我们去下载中文版的 main_menu.xml ,已经放在夸克网盘,永久免费分享中!一、数据库及表的创建。
2025-02-28 11:38:25
651
原创 MySQL学习第二天——常用命令
每个字段都有:字段名(普通名字)、数据类型(字符串、数字、日期等)、约束(唯一性约束等)等属性。3、DDL:数据定义语言(增删改表结构——非数据:create、drop、alter)2、DML:数据操作语言(增删改表数据:insert、delete、update)4、TCL:事务控制语言(事务提交commit;5、DCL:数据控制语言(授权grant;1、数据库中最基本的单元是表:table——用来存储数据。1、DQL:数据查询语言(select)一、常用命令(不区分大小写)1、启动数据库:输入密码。
2025-02-27 21:45:01
177
原创 MySQL学习第一天——MySQL概述
1、数据库(DB):存储数据的仓库,数据是有组织的进行存储2、数据库管理系统(DBMS):操纵和管理数据库的大型软件3、SQL:操作关系型数据库的编程语言,定义了一套操作关系型数据库统一标准4、主流的关系型数据库管理系统。
2025-01-13 20:38:20
350
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人