Python之Pandas

Pandas是Python中用于数据分析的重要库,基于Numpy扩展,适用于数据清洗、处理和分析。它允许处理异构数据,并广泛应用于金融、学术和统计等领域。Pandas的基础操作包括库的导入、数据读取与保存、索引赋值、数据表创建、基本运算及实用技巧。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Python之Pandas


一、pandas是什么?

pandas是"Python data analysis"的简称,字面意思的用在数据分析的,是以Numpy为基础的延申,Pandas 广泛应用在学术、金融、统计学等各个数据分析领域。

二、与Numpy的区别?

主要是矩阵里面的元素可以异构(可以不一样)

三、运用的地方

文件的读取与保存(excel、csv)
制作表

二、基础使用

1.引入库

import pandas as pd
import  ssl
ssl._create_default_https_context = ssl._create_unverified_context

2.读取和保存数据

形参 解释
header 指定第几行作为列名(忽略注解行),如果没有指定列名,默认header=0; 如果指定了列名header=None
index_col 默认为None 用列名作为DataFrame的行标签,如果给出序列,则使用MultiIndex。如果读取某文件,该文件每行末尾都有带分隔符,考虑使用index_col=False使panadas不用第一列作为行的名称。
dtype 例子: {‘a’: np.float64, ‘b’: np.int32} 指定每一列的数据类型,a,b表示列名
文件读取:

url形式
data = pd.read_csv(
    'https://labfile.oss.aliyuncs.com/courses/1283/adult.data.csv')
print(data.head())

本地形式
data =  pd.read_csv("./test1.txt", sep=' ') #以空格为分隔符读取文件至pandas表格中,其他默认
data =  pd.read_csv("./test1.txt", sep=' ', header=None, index_col=False, dtype=np.float64)

3.索引(赋值\修改)

行索引与列索引

----------------------------------
data = pd.DataFrame(np.arange(12, 24).reshape((3, 4)), index=["a", "b", "c"], columns=["A", "B", "C", "D"])
out:
	A 	B 	C 	D
a 	12 	13 	14 	15
b 	16 	17 	18 	19
c 	20 	21 	22 	23
----------
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值