Python|解决导入数据的时候memory error问题

最新推荐文章于 2024-09-11 17:27:51 发布

xiao黄

最新推荐文章于 2024-09-11 17:27:51 发布

阅读量734

点赞数

分类专栏：配置环境以及相关报错问题文章标签： python pandas 内存报错

本文链接：https://blog.csdn.net/Python_Matlab/article/details/110120331

版权

配置环境以及相关报错问题专栏收录该内容

14 篇文章

订阅专栏

本人在分析处理数据的时候，用pandas直接读取5.5G的csv文件吗，结果出现memory error，通过百度和借鉴大佬的博客，解决了这个问题。

是通过一次读取10000行来解决。

# path 为你的文件路径
data = pd.read_csv(filepath, sep=',',engine = 'python',iterator=True, header=None)
loop = True
chunkSize = 10000
chunks = []
index = 0
while loop:
    try:
        chunk = data.get_chunk(chunkSize)
        chunks.append(chunk)
        index += 1
        print('当前读到第%d行数据'%(index*chunkSize))

    except StopIteration:
        loop = False
        print("迭代结束")
print('开始合并')
data = pd.concat(chunks, ignore_index= True)
print('合并完成')