【Python数据分析与处理 实训02】 ---2012欧洲杯信息分析(数据过滤与排序)

本文通过Python的pandas库对2012欧洲杯足球赛数据进行分析,包括数据读取、导出Excel、列选择、球队数量统计、列操作、排序、统计计算等。涉及数据过滤、排序、分组聚合等核心概念。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

【Python数据分析与处理 实训02】 —2012欧洲杯信息分析(数据过滤与排序)


探索2012欧洲杯信息

对于下面的数据集进行简单的一些数据的分析训练
在这里插入图片描述

若需要源数据请私信~


读取数据

euro12 = pd.read_csv("G:\Projects\pycharmeProject\大数据比赛\泰迪智能科技\data\Euro2012.csv",sep=",",index_col=0)
print(euro12.head(10))

通过给定的数据集,可以发现原始数据中的第一列为team,第一行为字段列名,可以在读取的时候加入index_col=0可将第一列在读取时看成行名,这样数据集就变成每一个队伍的欧洲杯数据,当然也可以不使用该参数,根据具体情况来看。

在这里插入图片描述


1.将数据写出成一个excel文件

euro12.to_excel('G:\Projects\pycharmeProject\大数据比赛\泰迪智能科技\data\Euro12.xls')

通过to_excel()可以将结果集保存为excel表格

在这里插入图片描述


2.只选取Goals这一列。

print(euro12['Goals'])

在这里插入图片描述


3.有多少球队参与了2012欧洲杯?

print(euro12['Team'].nunique())

之前统计的时候,我们都使用unique先进行去重操作,然后再进行取size,今天介绍一个新方法nunique()n代表了个数number,可以直接获取去重数据后的个数

在这里插入图片描述


4.该数据集中一共有多少列(columns)?

print(euro12.shape[1])

在这里插入图片描述


5.将数据集中的列Team, Yellow Cards和Red Cards单独存为一个名叫discipline的数据框。

discipline = euro12[['Team', 'Yellow Cards', 'Red Cards']]         # 方式一
print(discipline)
discipline = euro12.loc[:, ['Team', 'Yellow Cards', 'Red Cards']]  # 方式二
print(discipline)

单独存为一个名叫discipline的数据框,简单的说就是提取所需要的有效列,可以通过切片的方式提取列后赋予一个新的变量来实行。

在这里插入图片描述


6.对数据框discipline按照先Red Cards再Yellow Cards进行排序。

print(discipline.sort_values(['Red Cards', 'Yellow Cards'], ascending=False))

排序操作,sort_values中参数传入要进行排序的列,当有多个列的时候使用[]包含起来

在这里插入图片描述


7.计算每个球队拿到的黄牌数的平均值。

print(discipline.groupby('Team').agg({'Yellow Cards': 'sum'}).mean())

在这里插入图片描述


8.找到进球数Goals超过6的球队数据。

index1 = euro12['Goals'] > 6
print(index1)
print(euro12.loc[index1, :])   # 数据框的第四种索引方式:根据逻辑值进行访问

在这里插入图片描述

9. 选取以字母G开头的球队数据。

isG = euro12['Team'].str[0] == "G"
print(isG)
print(euro12.loc[isG,:])

在这里插入图片描述


10. 选取前7列。

print(euro12.iloc[:,0:7])

在这里插入图片描述

在这里插入图片描述


11. 选取除了最后3列之外的全部列。

print(euro12.iloc[:,:-3])

在这里插入图片描述

在这里插入图片描述


12.找到英格兰(England)、意大利(Italy)和俄罗斯(Russia)的射正率(Shooting Accuracy)。

# 方法一
a = (euro12['Team'] == "England") | (euro12['Team'] == "Italy")  | (euro12['Team'] == "Russia")
print(a)
print(euro12.loc[a,"Shooting Accuracy"])

对于逻辑访问的应用 ,首先筛选出符合条件逻辑。然后再查询Shooting Accuracy。

在这里插入图片描述

# 方法二
euro12.set_index('Team',inplace=True)
print(euro12.loc[['England','Italy','Russia'],'Shooting Accuracy'])

我们还可以使用直接提取的方式,但是首先要做一个转变,就是将Team列设定为index,上面一种方法实际上在查询的时候,也是按照逻辑值为true的index去查询的,所以在这里,使用第二种方法,我们直接将Team列设为行索引去查询。

在这里插入图片描述


评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

骑着蜗牛ひ追导弹'

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值