python数据分析与挖掘实战(2)

本文深入探讨了Python中数据异常值的分析,通过describe()函数揭示数据的基本统计特性,并解决了使用boxplot()绘制箱线图时遇到的问题。接着,文章介绍了统计量分析,特别是帕累托分析在数据贡献度中的应用。最后,文章讲解了如何进行相关性分析,展示了如何在数据集中找出特定菜品销售的相关性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

异常值分析

  • describe()用法【注意:是describe不是describle!这个错误刚才找了好久,汗颜。。。】
    代码:
import pandas as pd
import numpy as np
catering_sale='E:\pycharm\python数据分析与挖掘实战数据及源码\chapter3\demo\data\catering_sale.xls'
data=pd.read_excel(catering_sale,index_col=u'日期')
print(data.describe())

运行结果:
在这里插入图片描述
count 非空数值
mean 平均值
std 标准差
min
25% 1/4分位数
50% 中位数
75%
max

实例:餐饮销额数据异常值代码检测
代码:

import pandas as pd
import numpy as np
catering_sale='E:\pycharm\python数据分析与挖掘实战数据及源码\chapter3\demo\data\catering_sale.xls'
data=pd.read_excel(catering_sale,index_col=u'日期')

import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = [ 'S
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值