图像增强
定义:对图像做旋转,翻转,剪切等变换以增加样本量
优点:扩充样本数量,增加数据多样性
mxnet:亚马逊选择的深度学习库
性质:一种框架(与tensorflow,Theano类似,为框架的一种)
特点:支持各种语言,python,R…
1.安装mxnet库
进入终端(terminal)
pip install mxnet
2.载入模块
%matplotlib inline
import d2lzh as d2l
import mxnet as mx
from mxnet import autograd, gluon, image, init, nd
from mxnet.gluon import data as gdata, loss as gloss, utils as gutils
import sys
import time
3.读取图像
d2l.set_figsize()
img = image.imread('0.jpg')
d2l.plt.imshow(img.asnumpy())
效果:
4.定义绘图函数
# 本函数已保存在d2lzh包中方便以后使用
def show_images(imgs, num_rows, num_cols, scale=2):
figsize = (num_cols * scale, num_rows * scale)
_, axes = d2l.plt.subplots(num_rows, num_cols, figsize=figsize)
for i in range(num_rows):
for j in range(num_cols):
axes[i][j].imshow(imgs[i * num_cols + j].asnumpy())
axes[i][j].axes.get_xaxis().set_visible(False)
axes[i][j].axes.get_yaxis().set_visible(False)
return axes
def apply(img, aug, num_rows=2, num_cols=4, scale=1.5):
Y = [aug(img) for _ in range(num_rows * num_cols)]
show_images(Y, num_rows, num_cols, scale)
5.翻转与裁剪
5.1左右翻转
#左右翻转
apply(img, gdata.vision.transforms.RandomFlipLeftRight())
效果:
5.2上下翻转
#上下翻转(不如左右翻转常用)
apply(img, gdata.vision.transforms.RandomFlipTopBottom())
5.3裁剪
shape_aug = gdata.vision.transforms.RandomResizedCrop(
(200, 200), scale=(0.1, 1), ratio=(0.5, 2))
apply(img, shape_aug)
6.变换颜色
变换指标:包含亮度,对比度,饱和度和色调的变换
6.1变换亮度
#变换亮度
apply(img, gdata.vision.transforms.RandomBrightness(0.5))
效果
6.2变换色调
#变换色调
apply(img, gdata.vision.transforms.RandomHue(0.5))
6.3上述各项指标一起变换
#各项指标一起变换
color_aug = gdata.vision.transforms.RandomColorJitter(
brightness=0.5, contrast=0.5, saturation=0.5, hue=0.5)
apply(img, color_aug)
效果:
7.叠加使用多个变换
叠加使用多个变换(翻转,颜色,裁剪等一同变换)
augs = gdata.vision.transforms.Compose([
gdata.vision.transforms.RandomFlipLeftRight(), color_aug, shape_aug])
apply(img, augs)