自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 sql技巧:将空值替换为序列的上一个非空值

方法简要说明方法优势方法劣势方法1开窗函数直接取,需要忽略空值效率最高、代码量最少很多数据库语言不支持开窗函数里忽略空值方法2做分组的辅助列,再p_id,辅助列聚合开窗用max取代码量少,可读性好,执行效率高,几乎所有数据库都支持方法3在select后面取字段时,用子查询关联原表,并限制死只取1个值效率比较高,代码量较少很多数据库语言不支持方法4做分组的辅助列,将每个p_id对应的的dept合并为数组,然后再按辅助列的顺序将数组拆开。适用大多数sql数据库,执行效率还可以。

2023-12-09 19:18:24 1941

原创 Mysql时间操作总结

当前日期/时间当前日期+时间:now()当前日期:curdate()或者current_date()当前时间:current_timestamp()或curtime()或current_time()日期/时间增加或减少增加7小时以下都可以date_add(‘2021-01-01 12:00:00’,interval 7 hour)convert_tz(‘2021-01-01 12:00:00’, ‘+00:00’, ‘+07:00’)减少7小时date_add(‘2021-01-0

2022-03-23 00:05:26 1189

原创 数据可视化——图表类型选择

可视化图表所具有的功能有很多,比如柱状图,通过不同类别的柱长,来代表每一类别数值大小,可起到不同类别之间做比较的功能。有些图表具有多种功能。比较:显示值与值之间的不同和相似之处。通常使用图形长度、面积、颜色来比较不同分类间数值的大小,也有用宽度、位置、角度等。比如最常见的柱状图,就具有比较的功能。分布:显示频率,数据分散在一个区间或分组。使用图形的位置、大小、颜色的渐变程度来表现数据的分布,通常用于展示连续数据上数值的分布情况。比如散点图、气泡图等,可以查看、分析数据的分布。

2021-01-03 22:00:43 12778 1

原创 学历教育项目用户(留资)特征体系总结

简单说下背景,我们一条产品线是学历提升,主要特点是高单价、转化周期长,用户通过我们的网络投放或者线下渠道,留下个人资料,每条用户资料我们简称为留资。我们目标是让留资数据尽可量丰富、准确、及时。对于留资特征,以下是我的总结。有些特征是已经能获取到且数据质量较好,还有些特征目前获取不到,只是一个思路。...

2020-09-23 17:50:10 831

原创 LendingClub贷款数据分析

开门见山目录:1 背景介绍2 基本数据处理3 公司总体分析4 贷款人分析5 用户特征与违约率的关系结论:没有特别提到年份的地方,默认是18年。公司:从贷款数量上来看,07年到15年,经营规模发展得很快,但是15年到18年,经营规模没有明显提高,尤其15年到17年,基本没有进步。13年的整体坏账率15.6%,13年到15年的3年期贷款坏账率逐年上升趋势明显。从贷款规模上看,公...

2020-03-08 21:29:43 6338 5

原创 如何在python中读取mysql中的数据并存为DataFrame

网上方法很多,我觉得这个是最简单的了。

2020-03-03 17:14:33 902 1

原创 Pandas的DataFrame如何一列升序一列降序

Python的DataFrame如何一列升序一列降序df2 = pd.DataFrame({'a':[1,1,1,1,2,2,2,2], 'b':list(range(8)), 'c':list(range(8,0,-1))})print(df2)print(df2.sort_values(['a','c']))#多列...

2019-12-03 21:42:52 7621 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除