
数据分析
文章平均质量分 78
骨灰级收藏家
这个作者很懒,什么都没留下…
展开
-
MySQL如何实时同步数据到ES?试试这款阿里开源的神器
MySQL如何实时同步数据到ES?试试这款阿里开源的神器原创 2023-07-24 18:19:09 · 778 阅读 · 0 评论 -
数据分析应该怎么学习?适合什么人学?
数据分析应该怎么学习?适合什么人学?原创 2023-05-31 15:42:05 · 742 阅读 · 0 评论 -
Pandas高级操作,建议收藏(二)
在数据分析和数据建模的过程中需要对数据进行清洗和整理等工作,有时需要对数据增删字段。下面为大家介绍Pandas对数据的修改、数据迭代以及函数的使用。原创 2023-04-10 15:39:55 · 1546 阅读 · 0 评论 -
Pandas玩转文本处理
数据处理,也是风控非常重要的一个环节,甚至说是模型成败的关键环节。因此,娴熟简洁的数据处理技巧,是提高建模效率和建模质量的必要能力。原创 2023-04-04 17:02:39 · 1275 阅读 · 0 评论 -
Pandas高级操作,建议收藏(一)
在数据分析和数据建模的过程中需要对数据进行清洗和整理等工作,有时需要对数据增删字段。下面为大家介绍Pandas对数据的复杂查询、数据类型转换、数据排序的使用。原创 2023-04-04 16:24:38 · 1209 阅读 · 0 评论 -
PowerBI 报表页的基本操作
报表页是用户使用 Power BI 进行操作的主要对象和载体,下面介绍报表页的新建、设置、 删除等基本操作。原创 2023-03-29 18:42:02 · 1218 阅读 · 0 评论 -
最强的Python可视化神器,你有用过么?
数据分析离不开数据可视化,我们最常用的就是Pandas,Matplotlib,Pyecharts当然还有Tableau,看到一篇文章介绍Plotly制图后我也跃跃欲试,查看了相关资料开始尝试用它制图。原创 2023-03-21 16:46:09 · 2121 阅读 · 0 评论 -
什么是数据分析?数据分析流程都有啥呢?
指用专业的统计分析方法对大量数据进行分析,并加以详细研究和概括总结,提取有价值的信息,形成有效的分析结论,从而影响业务决策原创 2023-03-16 17:24:57 · 687 阅读 · 0 评论 -
网易数据分析业务面试笔试题
网易数据分析业务面试笔试题原创 2023-03-06 17:31:13 · 619 阅读 · 0 评论 -
AI模型神预测谁是卡塔尔世界杯冠军
AI模型神预测谁是卡塔尔世界杯冠军原创 2022-12-06 16:05:34 · 1173 阅读 · 0 评论 -
数据挖掘和数据仓库之间的区别
数据挖掘和仓储对于任何希望在全球或国家层面获得认可的组织来说都是必不可少的两个过程。这两种技术都有助于防止数据欺诈并提高管理统计数据和排名。数据挖掘用于依靠在数据仓库阶段收集的数据来检测重要模式。原创 2022-09-29 18:50:45 · 1903 阅读 · 0 评论 -
MySQL数据库之关系型数据库管理系统介绍
MYSQL数据库之关系型数据库管理系统介绍,数据库管理系统为管理关系型数据库而设计的软件系统,负责管理不同的数据库,而每个数据库里面会有一系列数据文件。对于程序员来讲重点是数据的增、删、改、查,必须熟练编写DQL、DML。学习目标:数据库和数据库管理系统的关系1.关系型数据库管理系统是什么?数据库管理系统(英语全拼:Relational Database Management System,简称RDBMS)是为管理关系型数据库而设计的软件系统,如果大家想要使用关系型数据库就需要安装数据库管理系统原创 2022-05-30 17:27:34 · 1020 阅读 · 0 评论 -
Spark SQL 结构化数据处理流程及原理是什么?
Spark SQL 结构化数据处理流程及原理是什么?Spark SQL 可以使用现有的 Hive 元存储、SerDes 和 UDF。它可以使用 JDBC/ODBC 连接到现有的 BI 工具。有了 Spark SQL,用户可以编写 SQL 风格的查询。Spark SQL 是 Spark 生态系统中处理结构化格式数据的模块。它在内部使用 Spark Core API 进行处理,但对用户的使用进行了抽象。这篇文章深入浅出地告诉你 Spark SQL 3.x 的新内容。这对于精通结构化查询语言或 SQL 的原创 2022-05-25 13:50:00 · 420 阅读 · 0 评论 -
几种常见的数据同步方式
数据仓库的特性之一是集成,即首先把未经过加工处理的、不同来源的、不同形式的数据同步到ODS层,一般情况下,这些ODS层数据包括日志数据和业务DB数据。对于业务DB数据而言(比如存储在MySQL中),将数据采集并导入到数仓中(通常是Hive或者MaxCompute)是非常重要的一个环节。那么,该如何将业务DB数据高效准确地同步到数仓中呢?一般企业会使用两种方案:直连同步实时增量同步(数据库日志解析)其中直连同步的基本思路是直连数据库进行SELECT,然后将查询的数据存储到本地文件作为中间存原创 2022-05-19 14:36:34 · 17727 阅读 · 0 评论 -
做数据分析为什么梳理标签体系很重要?
做数据分析为什么梳理标签体系很重要?在提升能力是要先会打一个标签再掌握整个体系。围绕某个业务实现业务闭环操作的若干个标签组合,称为标签体系,单一的标签没办法满足闭环操作的需求,因此需要标签体系。一、什么是标签“体系”?围绕一个业务场景实现业务闭环操作的若干个标签组合称为标签体系。单一的标签没办法满足闭环操作的需求需要标签体系。想要促使用户消费需要掌握用户的行为:分析用户、选择渠道、创作广告、选择商品、给予优惠。这样至少得五个标签才能把“发一条信息提醒用户来消费”这件事给办成了。这就是围绕:发信息原创 2022-05-04 18:52:05 · 825 阅读 · 0 评论