
神经网络论文研读
文章平均质量分 88
丰。。
这个作者很懒,什么都没留下…
展开
-
神经网络论文研读-多模态方向-综述研读(上)
图1:LMU印章(左)风格转移到梵高的向日葵绘画(中)并与提示混合 - 梵高,向日葵 -通过CLIP+VGAN(右)。在过去的几年中,自然语言处理(NLP)和计算机视觉中使用的方法取得了一些突破。除了对单模态模型的这些改进之外,大规模多模态方法已成为一个非常活跃的研究领域。在本次研讨会中,我们回顾了这些方法,并试图创建一个坚实的该领域的概述,从当前最先进的方法分别是深度学习的两个子领域。原创 2023-08-18 19:06:11 · 212 阅读 · 0 评论 -
深度学习神经网络学习笔记-论文研读-transformer及代码复现参考
优势序列转导模型基于复杂的循环或包括一个编码器和一个解码器的卷积神经网络。最好的表现良好的模型还通过attention 连接编码器和解码器机制。我们提出了一种新的简单的网络架构,Transformer, 完全基于注意力机制,省去了递归和卷积完全。在两个机器翻译任务上的实验表明,这些模型可以质量优越,同时具有更强的并行性和显著的要求训练时间更少。我们的模型在WMT 2014 英语-上达到 28.4 BLEU在现有的最佳结果上有所提升,包括超过 2 个 BLEU。原创 2023-07-05 20:40:36 · 1145 阅读 · 0 评论 -
kaggle学习笔记-otto-baseline11
一个计算购物车/订单的受欢迎程度,给定用户之前的点击/购物车/订单。一个计算给定用户以前的购物车/订单的购物车/订单的受欢迎程度。我们可以通过工程特征来改进这个模型,将它们合并到项目和用户,并训练一个重新排名模型(如 XGB)来选择我们最终的 20 个。因此,我们的任务是预测 1,671,803 个测试“用户”(即“会话”)中的每一个在未来会做什么。对于每个测试“用户”(即“会话”),我们必须预测他们在为期一周的测试期间的剩余时间内将点击、购物车和订购的内容。购物车/订单到购物车/订单的共同访问矩阵。原创 2023-01-27 21:11:25 · 183 阅读 · 0 评论 -
深度学习神经网络学习笔记-多模态方向-15-Sentiment Analysis of Customer Reviews of Food Delivery Services Using Deep Le
2019 冠状病毒病危机期间,顾客不愿在餐厅等候,更喜欢让外卖送到家门口,这推动了外卖服务(FDSs)的增长。随着所有餐厅(如 UberEAT S、Menulog 或 Deliveroo)上线并引入 FDSs,在线平台上的客户评论已成为公司业绩的重要信息来源。FDS 组织旨在收集客户反馈中的投诉,并有效利用这些数据来确定需要改进的地方,以提高客户满意度。这项工作旨在回顾机器学习(ML)和深度学习(DL)模型以及可解释人工智能(XAI)方法,以预测 FDS 领域的客户情绪。一篇文献综。原创 2023-06-02 20:40:32 · 10 阅读 · 0 评论 -
深度学习神经网络学习笔记-多模态方向-13- Multimodal machine learning: A survey and taxonomy
本文为简单机翻,参考学习用1多模态机器学习:综述与分类Tadas Baltruˇsaitis, Chaitanya Ahuja,和Louis-Philippe Morency抽象——我们对世界的体验是多模态的——我们看到物体,听到声音,感觉到纹理,闻到气味,尝到味道。模态是指某件事情发生或体验的方式,当一个研究问题包含多个这样的模态时,它就被称为多模态。为了让人工智能在理解我们周围的世界方面取得进展,它需要能够一起解释这样的多模态信号。多模态机器学习旨在建立能够处理和关联来自多种模态的信息的模型。它原创 2023-05-23 19:00:23 · 1845 阅读 · 2 评论 -
深度学习神经网络学习笔记-多模态方向-12-DBpedia: A Nucleus for a Web of Open Data
DBpedia是一个社区努力从维基百科中提取结构化信息,并使这些信息在网络上可用。DBpedia允许您对来自维基百科的数据集提出复杂的查询,并将网络上的其他数据集链接到维基百科数据。我们描述了DBpedia数据集的提取,以及产生的信息如何在网络上发布,供人类和机器消费。我们描述了来自DBpedia社区的一些新兴应用,并展示了网站作者如何在他们的网站内促进DBpedia内容的发展。最后,我们介绍了DBpedia与网络上其他开放数据集互联的现状,并概述了DBpedia如何可以作为新兴开放数据网络的核心。原创 2023-05-23 14:47:56 · 1524 阅读 · 0 评论 -
深度学习神经网络学习笔记-多模态方向-11-Deep Voice: Real-time Neural Text-to-Speech
本文提出Deep Voice,一种完全由深度神经网络构建的生产质量文本到语音系统。Deep Voice为真正的端到端神经语音合成奠定了基础。该系统由五个主要的构建模块组成:用于定位音素边界的分割模型、字素到音素的转换模型、音素时长预测模型、基频预测模型和音频合成模型。对于分割模型,我们提出了一种使用连接时序分类(CTC)损失的深度神经网络执行音素边界检测的新方法。对于音频合成模型,我们实现了WaveNet的一个变体,比原始模型需要更少的参数,训练速度更快。原创 2023-05-23 14:20:40 · 1484 阅读 · 0 评论 -
深度学习神经网络学习笔记-多模态方向-10-Neural Voice Cloning with a Few Samples
语音克隆是个性化语音接口非常需要的功能。我们介绍了一个神经语音克隆系统,该系统仅从少数音频样本中学习合成一个人的声音。我们研究了两种方法:说话人适应和说话人编码。说话人自适应是基于多说话人生成模型的微调。说话人编码是基于训练一个单独的模型来直接推断一个新的说话人嵌入,这将被应用到一个多说话人生成模型中。从语音的自然度和与原始说话人的相似度来看,这两种方法都可以获得很好的性能,即使有一些克隆音频。原创 2023-05-22 19:14:57 · 764 阅读 · 0 评论 -
深度学习神经网络学习笔记-多模态方向-09-VQA: Visual Question Answering
我们提出了自由形式和开放式视觉问答(VQA)的任务。给定一张图像和一个关于图像的自然语言问题,任务是提供一个准确的自然语言答案。镜像现实场景,比如帮助视障人士,问题和答案都是开放式的。视觉问题有选择地针对图像的不同区域,包括背景细节和底层上下文。因此,在VQA上取得成功的系统通常需要比生成通用图像标题的系统更详细地了解图像和复杂的推理。此外,VQA适合自动评估,因为许多开放式答案只包含几个单词或一组封闭的答案,这些答案可以以多项选择的形式提供。原创 2023-05-22 14:47:57 · 2390 阅读 · 0 评论 -
深度学习神经网络学习笔记-多模态方向-08-Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answ
自顶向下的视觉注意机制已广泛应用于图像字幕和视觉问答(VQA)中,通过细粒度分析甚至多步推理,实现更深层次的图像理解。在这项工作中,我们提出了一种自下而上和自上而下相结合的注意机制,使注意力能够在物体和其他突出图像区域的层面上进行计算。这是需要考虑的注意力的自然基础。在我们的方法中,自下而上的机制(基于Faster R-CNN)提出图像区域,每个区域都有一个相关的特征向量,而自上而下的机制决定特征权重。原创 2023-05-22 14:08:18 · 593 阅读 · 0 评论 -
深度学习神经网络学习笔记-多模态方向-07-Don’t Just Assume; Look and Answer: Overcoming Priors for Visual Question Answ
大量研究发现,如今的视觉问答(VQA)模型在很大程度上是由训练数据中的表面相关性驱动的,并且缺乏足够的图像基础。为了鼓励面向后者的模型的发展,我们为VQA提出了一种新的设置,其中对于每种问题类型,训练和测试集都有不同的答案的先验分布。具体来说,本文提出了VQA v1和VQA v2数据集的新划分,称为先验变化下的视觉问题回答(分别为VQA-CP v1和VQA-CP v2)。首先,我们在这个新设置下评估了几个现有的VQA模型,并表明它们的性能与原始VQA设置相比显著下降。原创 2023-05-19 20:08:08 · 534 阅读 · 0 评论 -
深度学习神经网络学习笔记-多模态方向-06-VQA-Med: Overview of the Medical Visual Question Answering Task at ImageCLEF 2
本文介绍了ImageCLEF 2019上的医学视觉问答任务(VQA-Med)的概述。参与系统的任务是根据放射学图像的视觉内容回答医学问题。在VQA-Med的第二版中,我们重点讨论了四类临床问题:模态、平面、器官系统和异常。利用分类和文本生成方法,这些类别的设计具有不同程度的难度。我们还确保所有问题都可以从图像内容中回答,而不需要额外的医学知识或特定领域的推理。我们创建了一个包含4200个放射学的新数据集遵循这些指导方针的图像和15292个问题-答案对。原创 2023-05-19 16:56:49 · 545 阅读 · 0 评论 -
深度学习神经网络学习笔记-多模态方向-05-An Efficient Normalized Restricted Boltzmann Machine for Solving Multiclass Cl
利用计算机视觉和图像处理基于未标记图像的多类分类是目前的一个重要问题。在这项研究中,我们重点研究了为类驱动的无标记数据构建高级特征检测器的现象。我们提出了一种归一化受限玻尔兹曼机(NRBM)来形成一个鲁棒的网络模型。所提出的NRBM的开发是为了实现降维的目标,并在学习更合适的数据特征方面提供更好的特征提取,并进行增强。为了提高学习收敛速度并降低NRBM的复杂度,我们在训练更新参数时添加了Polyak平均法。原创 2023-05-19 15:14:28 · 645 阅读 · 0 评论 -
K-means聚类
具体而言,可以先随机分配数据点到簇中,然后依次更新每个簇的中心点,直到簇中心点不再发生变化或达到最大迭代次数。具体而言,可以先随机分配数据点到簇中。更新:在所有数据点都被分配到对应的聚类中之后,重新计算每个聚类中心点的位置,即将每个聚类中的所有数据点的坐标平均值作为新的聚类中心点位置。由于将xi分配到距离其最近的簇中时,ΔJ应当小于等于0,因此可以通过比较ΔJ的大小,将xi分配到距离其最近的簇中。分配:对于每个数据点,计算其到每个聚类中心点的距离,并将其分配到距离最近的聚类中心点所代表的聚类中。原创 2023-03-07 19:39:35 · 861 阅读 · 1 评论 -
协同多智能体学习的价值分解网络的原理与代码复现
多智能体协同的价值函数问题原创 2022-07-24 20:23:22 · 1327 阅读 · 1 评论 -
组会汇报(本科)-在复杂楼层背景下,一种基于深度强化学习的目的楼层预约调度算法的多智能体电梯群控系统的研究
在复杂楼层背景下,一种基于深度强化学习的目的楼层预约调度算法的多智能体电梯群控系统的研究原创 2022-07-14 15:20:44 · 2525 阅读 · 0 评论 -
深度学习学习笔记---------RIAL算法/增强智能体间学习
多智能体间的通信问题原创 2022-07-12 21:23:26 · 776 阅读 · 0 评论 -
深度学习学习笔记-论文研读4-基于深度强化学习的多用户边缘计算任务卸载调度与资源分配算法
论文研读原创 2022-07-04 12:26:17 · 5739 阅读 · 4 评论 -
深度学习学习笔记-论文研读3-基于低秩约束的熵加权多视角模糊聚类算法
多视角模糊聚类算法原创 2022-07-03 18:14:02 · 480 阅读 · 0 评论 -
深度学习学习笔记-论文研读2-车联网边缘计算环境下基于深度强化学习的分布式服务卸载方法
本人学识浅薄,如有对论文理解不到位的地方还请大佬们指出原创 2022-07-02 21:08:02 · 2312 阅读 · 1 评论 -
深度学习学习笔记-神经网络论文研读-pix2pix
概念引入gan的通俗理解摘要1.研究条件生成式对抗网络在图像翻译任务中的通用解决方案2.网络不仅学习从输入图像到输出图像的映射,还学习了用干训练该映射的损失函数3.证明了这种方法可以有效应用在图像合成、图像上色等多种图像翻译任务中4.使用作者发布的pix2pix软件,大量用户已经成功进行了自己的实验,进一步证明了此方法的泛化性5. 这项工作表明可以在不手工设计损失函数的情况下,也能获得理想的结果研究背景图像翻译问题图像翻译技术能够将图像中内容从一个图像域X转换到另一个图像域Y,可以看作是原创 2022-05-06 10:46:45 · 346 阅读 · 1 评论 -
强化学习学习笔记-时间差分算法
概述时序差分算法是一种无模型的强化学习算法。它继承了动态规划(Dynamic Programming)和蒙特卡罗方法(Monte Carlo Methods)的优点,从而对状态值(state value)和策略(optimal policy)进行预测概念引入自举法我们的项目并不总是有充足的数据。通常,我们只有一个样本数据集可供使用,由于缺乏资源我们无法执行重复实验(例如A/B测试)。幸运的是,我们有重采样的方法来充分利用我们所拥有的数据。自举法(Bootstrapping)是一种重采样技术。理想情原创 2022-04-20 10:59:52 · 636 阅读 · 0 评论 -
强化学习学习笔记-动态规划
定义动态规划(Dynamic Programming,DP)是运筹学的一个分支,是求解决策过程最优化的过程。20世纪50年代初,美国数学家贝尔曼(R.Bellman)等人在研究多阶段决策过程的优化问题时,提出了著名的最优化原理,从而创立了动态规划。动态规划的应用极其广泛,包括工程技术、经济、工业生产、军事以及自动化控制等领域,并在背包问题、生产经营问题、资金管理问题、资源分配问题、最短路径问题和复杂系统可靠性问题等中取得了显著的效果。适用范围1最优子结构满足最优性原理最优的解可以被分解成子问题原创 2022-04-13 11:47:23 · 447 阅读 · 0 评论 -
动态规划-强化学习学习笔记(三)
概念引入强化学习的通俗理解马尔可夫决策过程简介动态规划(Dynamic Programming,DP)是运筹学的一个分支,是求解决策过程最优化的过程。20世纪50年代初,美国数学家贝尔曼(R.Bellman)等人在研究多阶段决策过程的优化问题时,提出了著名的最优化原理,从而创立了动态规划。动态规划的应用极其广泛,包括工程技术、经济、工业生产、军事以及自动化控制等领域,并在背包问题、生产经营问题、资金管理问题、资源分配问题、最短路径问题和复杂系统可靠性问题等中取得了显著的效果 。动态规划的适用范围原创 2022-01-20 15:38:10 · 2281 阅读 · 0 评论 -
马尔可夫决策过程-强化学习学习笔记(二)
概念引入强化学习的通俗理解马尔可夫的通俗介绍简介马尔可夫决策过程 (Markov Decision Processes, MDPs)是对强化学习问题的数学描述.马尔可夫决策过程(Markov Decision Process, MDP)是序贯决策(sequential decision)的数学模型,用于在系统状态具有马尔可夫性质的环境中模拟智能体可实现的随机性策略与回报 。MDP的得名来自于俄国数学家安德雷·马尔可夫(Андрей Андреевич Марков),以纪念其为马尔可夫链所做的研原创 2022-01-19 15:51:07 · 4235 阅读 · 0 评论 -
深度学习神经网络学习笔记-自然语言处理方向-论文研读-情感分析/文本分类-textcnn
概念引入逻辑回归线性回归时间序列分析神经网络self-attention与softmax的推导word2evcglove摘要大意在使用简单的CNN模型在预训练词向量的基础上进行微调就可以在文本分类任务上就能得到很好的结果。通过对词向量进行微调而获得的任务指向的词向量就能得到更好的结果。同时也提出了一种即使用静态预训练词向量又使用任务指向词向量的文本分类模型。最终在7个文本分类任务中的四个上都取得了最好的分类准确率。TextCNN模型的结构把每个词都映射成一个词向量,然后做一维原创 2021-08-13 17:51:11 · 1046 阅读 · 2 评论 -
深度学习神经网络学习笔记-自然语言处理方向-论文研读-情感分析/文本分类-char_embedding
本文目录概念引入由来摘要大意C2W模型语言模型的训练流程词性标注模型研究成果概念引入逻辑回归线性回归时间序列分析神经网络self-attention与softmax的推导word2evc由来词向量的学习在自然语言处理的应用中非常重要,词向量可以在空间上捕获词之间的语法和语义相似性。但是词向量机制中是假设词和词之间是独立的,这种独立性假设是有问题的,形式的一致性会导致功能的一致性。但这种形态和功能之间的关系有不是绝对的,为了学习这种关系,本文在字符嵌入上使用双向LSTM来捕捉这种关系。 本文原创 2021-08-12 20:58:40 · 7000 阅读 · 0 评论 -
深度学习神经网络学习笔记-自然语言处理方向-论文研读-情感分析/文本分类-glove-Global Vectors for Word Representation
概念引入逻辑回归线性回归时间序列分析神经网络self-attention与softmax的推导word2evc该篇论文的背景word2evc提出的方法无法使用全局的统计信息矩阵分解方法在词对推理的任务上表现很差模型效果对比在词对推理的数据集上取得了良好的效果(图中模型中地最好结果)...原创 2021-08-11 22:00:34 · 7072 阅读 · 0 评论 -
深度学习神经网络学习笔记-自然语言处理方向-论文研读-情感分析/文本分类-word2evc-基于向量空间中词表示的有效估计
word2evc-基于向量空间中词表示的有效估计目录概念引入摘要大意介绍词的表示方式评价指标词向量训练方式研究成果概念引入逻辑回归线性回归时间序列分析神经网络self-attention与softmax的推导语言模型语言模型(language model, LM)在自然语言处理中占有重要的地位,尤其在基于统计模型的语音识别、机器翻译、汉语自动分词和句法分析等相关研究中得到了广泛应用。概率P:语言模型是计算一个句子是是句子的概率。比如,对ni hao的判定你好 P = 0.8腻浩原创 2021-08-10 21:16:21 · 7877 阅读 · 0 评论 -
深度学习学习笔记-双向LSTM-CRF模型论文研读
概念引入命名实体识别命名实体识别(Named Entity Recognition,NER)是NLP中一项非常基础的任务。NER是信息提取、问答系统、句法分析、机器翻译等众多NLP任务的重要基础工具。定义命名实体识别(Named Entity Recognition,简称NER),又称作“专名识别”,是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等。简单的讲,就是识别自然文本中的实体指称的边界和类别。信息抽取信息抽取(information extraction),即从自原创 2021-07-25 21:57:15 · 5091 阅读 · 1 评论 -
深度学习神经网络论文研读-自然语言处理方向-elctra
深度学习神经网络论文研读-自然语言处理方向-elctra-目录概念引入ELECTRA比BERRT快的原因摘要elctra的判别器与生成器模型训练其他训练方式效果比较论文意义概念引入该篇论文对GAN有要求,对GAN不熟悉的朋友,可以先看这篇博文简单理解下MASK机制的简单理解有关NLP的一些基本概念详见ELECTRA比BERRT快的原因背景当今的SOTA的预训练语言模型,比如BERT,采用Mask language model(MLM)的方式破坏输入的内容,通过双向语言模型进行预测重构;然而原创 2021-08-04 20:41:02 · 2654 阅读 · 0 评论 -
对抗生成神经网络-GAN通俗理解
对抗生成神经网络-GAN通俗理解概念引入对抗生成神经网络效果的演变由来简介生成模型判别器工作原理损失函数--交叉熵损失函数(BCE)拓展-DCGAN网络架构概念引入超分辨率重构图像超分辨率重构(super resolution,SR)是指利用计算机将一幅低分辨率图像(low resolution,LR)或图像序列进行处理,恢复出高分辨率图像(high resolution,HR)的一种图像处理技术。HR意味着图像具有高像素密度,可以提供更多的细节,这些细节往往在应用中起到关键作用 。原理:让计算机同原创 2021-08-03 16:27:18 · 5931 阅读 · 0 评论 -
机器学习学习梳理
从最初开始一切事物的存在都有其合理性基于现有的数据来预测未来的数据,我们把这个过程称之为学习,又因为是机器在执行这个过程,故我们称之为机器学习。最开始的算法与数学并无太大关联,只是因为确实需要(优化计算流程,减少计算时间),所以后面引入了数学。最简单的自然就是不用动脑的先讲一个引子,假如用无限猴子放在无限的空间中让它们一直不停的敲击键盘,相信总有那么一天会成功的敲击出《哈姆雷特》最明显的例子就是随机+遍历(联想对密码的野蛮破解)def random_linear_function(): min原创 2021-04-22 15:36:40 · 189 阅读 · 0 评论 -
神经网络论文研究--图像处理方向5-yolov1的研读
这是个目标检测算法思想:把目标检测问题作为回归问题处理介绍了yolo算法及其速度快的优点优点:速度块,把目标检测问题作为回归问题处理,流程简单,只需输入一张图模型泛化能力优秀,与DPM,R-NN相比,还是因为利用了整张图的信息具有全局推理能力,假阳性错误少,即把背景当物体的错误少缺点:精度与sta相比并不高,对小物体不友好论文的内容摘要我们提出了YOLO,一种新的目标检测方法,重新调整分类目标检测算法的前期工作执行。我们构建的目标检测框架将目标检测问题视为回归问题,在空间上分开物体的边原创 2021-04-12 12:01:07 · 1338 阅读 · 0 评论 -
蒙特卡洛树搜索(The monte carlo search tree)
蒙特卡洛树搜索又称随机抽样或统计试验方法,属于计算数学的一个分支,它是在上世纪四十年代中期为了适应当时原子能事业的发展而发展起来的。传统的经验方法由于不能逼近真实的物理过程,很难得到满意的结果,而蒙特卡洛树搜索方法由于能够真实地模拟实际物理过程,故解决问题与实际非常符合,可以得到很圆满的结果。这也是以概率和统计理论方法为基础的一种计算方法,是使用随机数(或更常见的伪随机数)来解决很多计算问题的方法。将所求解的问题同一定的概率模型相联系,用电子计算机实现统计模拟或抽样,以获得问题的近似解。在搜索空间巨大的情原创 2021-04-11 16:55:41 · 2171 阅读 · 0 评论 -
神经网络论文研究-图像处理方向4-geoglenet
该篇论文的亮点提出了名为incept的卷积神经网络结构效果:ILSVRC-2014分类和检测任务巅峰加深和加宽了网络结构更好地利用了网络结构内的计算资源,计算效率提升显著基于赫布原则和多尺度观测相比VGG参数量减少12倍思考如何提高深度神经网络的运行效果:加深网络(增加层数)加宽网络(增加一层内的卷积核数)由此带来的副作用::数据量不足时容易陷入局部最优解问题(过拟合)增加了对计算机资源的要求于是由此引出了问题怎么才能改进深度神经网络呢1引入稀疏性2引入稀疏卷积结构,同时借原创 2021-04-03 22:20:30 · 394 阅读 · 0 评论 -
神经网络论文研究-图像处理方向3-resnet-残差网络
该篇论文的由来:接上一篇VGG当网络层数超过20的时候其训练效果并不会提高的哪去,这篇论文就是在解决这个问题核心观念:深层次表征的信息是很多视觉任务的核心点基于这些问题,本论文提出了残差学习(Residual learning)作为对应的解决方法残差函数(residual function)容易优化随着深度的提升,准确率提升显著很好地学习了深度特征表示即通俗理解地高级语义信息摘要翻译更深的神经网络更难训练,我们现有的残差学习框架比我们以前使用的更加容易去充分地训练深层神经网络。作为代替学原创 2021-03-29 21:13:06 · 1079 阅读 · 0 评论 -
神经网络论文研究--图像处理方向1-alxnet的研读
首先对比图像分类的步骤机器学习领域1特征提取(很考验使用者的经验)2特征筛选3输入分类器简单来说就是基于机器学习深度学习领域特征的提取,筛选,分类集成于一体简单来说就是基于神经网络论文框架摘要(abstruct)部分介绍了alexnet网络结构及成果⬇⬇⬇⬇⬇⬇⬇⬇⬇⬇⬇⬇⬇⬇介绍(introduction)部分,说明了神经网络在算力更好的GPU与更加强大的数据的加持下会有更好的结果(硬件与Garbage in,Garbage out)⬇⬇⬇⬇⬇⬇⬇⬇⬇⬇⬇⬇⬇⬇ILSVRC原创 2021-03-25 12:40:19 · 813 阅读 · 0 评论 -
神经网络论文研究-图像处理方向2-VGG
前置知识补充:感受野(Receptive field)定义:卷积神经网络每一层输出的特征图(feature map)上的像素点在原始图像上映射的区域大小原理:通过构建多个小卷积核来使之达到大卷积核的效果,降低计算负担,提高计算效率,增加非线性与神经网络深度比如上图,堆叠了3个33的卷积层,保持滑动窗口步长为1,那么其感受野就是77效果与使用一个7*7的卷积核结果一样假设一个模型的输入大小是hwc,并且使用c个卷积核,现在我们计算一下它们所需的参数一个77的卷积核::c(77c) = 49c原创 2021-03-27 16:58:10 · 845 阅读 · 1 评论