numpy.lib.stride_tricks.as_strided() 高效切分数组

本文深入解析Numpy库中的as_strided函数,该函数能高效地将数组分割成指定形状的块,适用于数据处理和机器学习场景。文章通过实例展示了如何设定strides参数以实现数组的灵活切分,同时解释了strides属性在内存布局中的作用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Numpy的一个函数:np.lib.stride_tricks.as_strided()
这个函数可以高效地切分一个数组为不同的shape块。可以参考官方文档或者这篇写得很好的博客
描述:

numpy.lib.stride_tricks.as_strided(x, shape=None, strides=None, subok=False, writeable=True)

其中:x为输入数组;
shape为目标形状;
strides 需要一个例子来理解:

a = np.arange(9, dtype=np.int32).reshape(3,3)
print(a)
'''
[[0 1 2]
 [3 4 5]
 [6 7 8]]
 '''
print(a.strides)
'''
(12, 4)
'''

这里(12, 4)中的12表示在内存中a[n, 0]到a[n+1, 0]跨过多少byte,4表示在内存中a[n, 0]到a[n, 1]跨过多少byte。不同数据类型占据的内存大小不同,总的来说一个32位的类型需要4byte,64位的类型需要8byte。 可以参考这里,我整理成下面的表格。

数值 \ 数值类型 (单位:Byte)int32int64float32float64
[]96969696
[1]100104100104
[5]116136116136

这个表格的意思就是,一个空的数组[]就占用内存96byte,因为它存放了关于数组大小等信息。
只有一个32位整数的数组[1]占用内存100byte,减去[]占用的96byte,1就占用4byte。
同理对于64整数的数组[1],一个元素占用8byte。
上面的例子中,使用nbytes和itemsize可以直接查看元素占据的内存。

# 查看数组a所有元素占用内存大小,单位byte
a.nbytes
"""
36
"""
# 查看数组a每个元素占用内存大小,单位byte
a.itemsize
"""
4
"""

如果我想将其切分为一个(3, 3, 3)矩阵,我需要先padding其为

[[0 0 0]
 [0 1 2]
 [3 4 5]
 [6 7 8]
 [0 0 0]]

结果如下:

[[[0 0 0]
  [0 1 2]
  [3 4 5]]

 [[0 1 2]
  [3 4 5]
  [6 7 8]]
 
 [[3 4 5]
  [6 7 8]
  [0 0 0]]]

需要设定的strides为(36, 12, 4). 第三维最小的维度考虑最小单元内两个相邻元素的跨度,0->1, 3->4, 6->7等都是4byte;第二维度考虑两行之间的跨度,如[0 1 2]->[3 4 5]中首元素的跨度为 3 ∗ 4 3*4 34 byte。这里的最高维跨度和第二维跨度一样,如[[0 0 0] [0 1 2] [3 4 5]]-> [[0 1 2] [3 4 5] [6 7 8]]首元素跨度在原数组中只跨越了[0 0 0]三个元素,所以跨度也是 3 ∗ 4 3*4 34 byte。

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值