欢迎关注微信公众号:excelwork
一直以来,Excel一直作为一个高效的数据展示、处理、分析的工具被我们使用,但随着处理量增大,不可避免的遇到长时间等待响应或干脆“未响应”。因此,我们需要找到替代工具来避免此类问题,Python中的pandas是如何像Excel一样处理数据呢。
先构造示例数据(python3):
import pandas as pd
data=pd.DataFrame([{2,5,6,7,8},(2,5,6,7,8),[12,31,4,5,6],range(11,111,20),range(9,23,3)],
columns=['col_a','col_b','col_c','col_d','col_e'],
index=['row_1','row_2','row_3','row_4','row_5'])
一、数据筛选、替换
1.1 数据筛选
我们通常使用去除重复项功能&#