- 博客(7)
- 收藏
- 关注
原创 sql技巧:将空值替换为序列的上一个非空值
方法简要说明方法优势方法劣势方法1开窗函数直接取,需要忽略空值效率最高、代码量最少很多数据库语言不支持开窗函数里忽略空值方法2做分组的辅助列,再p_id,辅助列聚合开窗用max取代码量少,可读性好,执行效率高,几乎所有数据库都支持方法3在select后面取字段时,用子查询关联原表,并限制死只取1个值效率比较高,代码量较少很多数据库语言不支持方法4做分组的辅助列,将每个p_id对应的的dept合并为数组,然后再按辅助列的顺序将数组拆开。适用大多数sql数据库,执行效率还可以。
2023-12-09 19:18:24
1941
原创 Mysql时间操作总结
当前日期/时间当前日期+时间:now()当前日期:curdate()或者current_date()当前时间:current_timestamp()或curtime()或current_time()日期/时间增加或减少增加7小时以下都可以date_add(‘2021-01-01 12:00:00’,interval 7 hour)convert_tz(‘2021-01-01 12:00:00’, ‘+00:00’, ‘+07:00’)减少7小时date_add(‘2021-01-0
2022-03-23 00:05:26
1189
原创 数据可视化——图表类型选择
可视化图表所具有的功能有很多,比如柱状图,通过不同类别的柱长,来代表每一类别数值大小,可起到不同类别之间做比较的功能。有些图表具有多种功能。比较:显示值与值之间的不同和相似之处。通常使用图形长度、面积、颜色来比较不同分类间数值的大小,也有用宽度、位置、角度等。比如最常见的柱状图,就具有比较的功能。分布:显示频率,数据分散在一个区间或分组。使用图形的位置、大小、颜色的渐变程度来表现数据的分布,通常用于展示连续数据上数值的分布情况。比如散点图、气泡图等,可以查看、分析数据的分布。
2021-01-03 22:00:43
12778
1
原创 学历教育项目用户(留资)特征体系总结
简单说下背景,我们一条产品线是学历提升,主要特点是高单价、转化周期长,用户通过我们的网络投放或者线下渠道,留下个人资料,每条用户资料我们简称为留资。我们目标是让留资数据尽可量丰富、准确、及时。对于留资特征,以下是我的总结。有些特征是已经能获取到且数据质量较好,还有些特征目前获取不到,只是一个思路。...
2020-09-23 17:50:10
831
原创 LendingClub贷款数据分析
开门见山目录:1 背景介绍2 基本数据处理3 公司总体分析4 贷款人分析5 用户特征与违约率的关系结论:没有特别提到年份的地方,默认是18年。公司:从贷款数量上来看,07年到15年,经营规模发展得很快,但是15年到18年,经营规模没有明显提高,尤其15年到17年,基本没有进步。13年的整体坏账率15.6%,13年到15年的3年期贷款坏账率逐年上升趋势明显。从贷款规模上看,公...
2020-03-08 21:29:43
6338
5
原创 Pandas的DataFrame如何一列升序一列降序
Python的DataFrame如何一列升序一列降序df2 = pd.DataFrame({'a':[1,1,1,1,2,2,2,2], 'b':list(range(8)), 'c':list(range(8,0,-1))})print(df2)print(df2.sort_values(['a','c']))#多列...
2019-12-03 21:42:52
7621
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人