Python 提取excel中嵌入的图片

注意:是嵌入在单元格里的图片,嵌入在单元格里的图片,嵌入在单元格里的图片
会显示这种类似的命令(office好像不支持查看,wps可以查看这个位置显示的图片)
在这里插入图片描述

网上好多都说用 _image 提取,经测试,这种方案不适用这种嵌入在单元格里的图片提取(经过查看源码,发现_image,方式也是在压缩包里根据图片名提取的图片,所以这种方式只能实现对excel中所有图片的提取,无法实现对应表格中对应的每一行表格中的图片以及本行内容提取并一一对应的功能)

查阅资料发现,xlsx文件 本质上也是一种特殊的压缩文件,所以,把xlsx文件后缀改成zip,即可得到类似这种结构

在这里插入图片描述

在 /xl 下找到 cellimages.xml 文件 ,这个文件就是存放图片和对应名称关系的xml文件
/xl/media 文件夹下存放的是所有嵌入的图片(有重复的只会存一个)

cellimages.xml文件中,下图中圈出来的就是

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值