手机CNN网络模型--MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications

最新推荐文章于 2023-06-13 10:53:32 发布

O天涯海阁O

最新推荐文章于 2023-06-13 10:53:32 发布

阅读量1.2w

点赞数 6

分类专栏： CNN网络结构和模型

本文链接：https://blog.csdn.net/zhangjunhit/article/details/70255444

版权

CNN网络结构和模型专栏收录该内容

27 篇文章

订阅专栏

MobileNets是一种专为移动设备设计的小型高效卷积神经网络。它利用Depthwise Separable Convolution显著减少计算量，适用于目标检测、细分类等多种视觉任务。网络结构可通过宽度和分辨率乘数调整。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications

https://arxiv.org/abs/1704.04861

https://github.com/hollance/MobileNet-CoreML
https://github.com/shicai/MobileNet-Caffe

本文是 Google 针对手机等嵌入式设备提出的一个小网络模型，叫 MobileNets，主要侧重于简单有效。

这个 MobileNets 可以干什么了？
这里写图片描述
目标检测、细分类、人脸属性分析、场景识别

3 MobileNet Architecture
这个模型主要依赖于 Depthwise Separable Convolution 来降低计算量

3.1. Depthwise Separable Convolution
我们首先来看看什么是 Depthwise Separable Convolution
一个标准的卷积层输入输出分别是：
输入特征图F尺寸假定为 F×F× M, 输出特征图 G 尺寸假定为 G×G× N，卷积层可以参数化为 K×K× N× N 卷积核，
这里写图片描述

这里写图片描述

标准卷积计算量为：
这里写图片描述

其实标准卷积一次性做了两件事：普通的卷积和特征数量的变化。Depthwise separable convolution 主要是将这两件事分开做。分为 depthwise convolutions 和 pointwise convolutions
depthwise convolutions 就是使用一个滤波器对每个输入通道进行卷积，特征数量保持不变
Pointwise convolution 就是使用一个 1×1 卷积，将M个输入特征变为 N个输出特征

这里写图片描述