- 博客(98)
- 问答 (1)
- 收藏
- 关注
原创 吴恩达深度学习——Seq2Seq模型
本文简要介绍了seq2seq 模型,其中,Beam 搜索算法是关键,每步保留概率最高的 k 个候选,通过不断计算和筛选来生成序列。还介绍了注意力模型的相关内容。
2025-02-16 10:54:15
572
原创 吴恩达深度学习——词嵌入
本文简要介绍词嵌入。首先介绍词表特征,阐述词嵌入空间中词汇以向量表示,不同词汇在特定维度有不同取值。接着讲解词嵌入的类比推理,通过公式推断词汇间的类比关系。随后引入嵌入矩阵,说明其维度及获取词向量的方法。介绍Word2Vec的跳字模型及相关计算过程与优化方法。
2025-02-14 17:25:00
1083
原创 吴恩达深度学习——序列模型
本文简要介绍了递归神经网络相关内容。递归神经网络先指出标准网络在自然语言处理中的问题,如输入输出长度不一等。接着介绍RNN,包括网络结构、前向传播(含初始状态、更新、输出计算等步骤)、反向传播计算,还提及多种RNN结构,如多对多、多对一等及其特点和应用场景。
2025-02-13 15:29:36
931
原创 吴恩达深度学习——卷积神经网络的特殊应用
本文简要介绍人脸识别与神经风格迁移展开。人脸识别部分,介绍了人脸验证和人脸识别的定义及面临的数据单一、数据库更新问题,还阐述了 Similarity 函数,包括 Siamese 网络实现及 Triplet 损失学习参数。神经风格迁移方面,说明了其是将图像内容与风格结合生成新图,介绍了深度卷积网络可视化,即输入图像经卷积、池化、全连接层输出结果,通过选取神经元找出激活图像块观察特征。
2025-02-08 23:37:49
920
1
原创 吴恩达深度学习——对象检测
文章首先介绍对象定位,不仅判断目标物体还要标记位置。然后介绍特征点检测,人脸检测中输出包含是否为人脸判断及关键点坐标。介绍基于滑动窗口的目标检测算法,但计算量较大,因此,将全连接层转化为卷积层。通过卷积实现滑动窗口检测算法能共享计算,提高效率。最后提到YOLO算法,通过在图像上划分网格进行分类和定位,能得到更精准的定位框,提升准确性。
2025-02-05 22:35:07
732
原创 吴恩达深度学习——卷积神经网络实例分析
简要介绍了几个经典的卷积神经网络。LeNet - 5 是早期经典网络。AlexNet 规模更大,使用了更多卷积层、池化层及全连接层,还采用了 ReLU 激活函数。VGG - 16 结构简洁,通过堆叠小尺寸卷积核加深网络。ResNets 则针对传统网络加深时的梯度消失、爆炸及性能退化问题提出新的思路,1*1卷积可以放大或缩小信息、调整通道和减少参数。
2025-02-05 09:26:19
1138
原创 吴恩达深度学习——卷积神经网络基础
文章主要介绍了矩阵、张量以及卷积相关知识。边缘检测是计算机视觉技术,通过过滤器与原矩阵对应元素相乘求和来识别图像边缘。卷积有Valid卷积和Same卷积之分,卷积步长会影响输出矩阵大小。三维卷积要求输入张量与过滤器通道数相同,多个过滤器会得到不同通道数的输出张量。单层卷积网络涉及线性函数、激活函数等运算,最终得到特定大小的输出张量。
2025-02-03 20:56:05
1138
原创 吴恩达深度学习——机器学习的策略
本文首先阐述了正交化,以电视旋钮设计为例说明其能让调节更易,机器学习不同阶段需遵循正交化原则。接着介绍单一数字评估指标,如准确率、召回率及F1 - score。还讲解了满足指标和优化指标的区别。随后谈及训练、开发、测试集的划分要点及更改方法,包括错误计算公式。最后介绍了贝叶斯错误率和人类水平错误率,分析二者与训练、开发集错误率的关系,强调要减少偏差和方差。
2025-02-02 17:14:56
1036
原创 吴恩达深度学习——超参数调试
本文先介绍超参数调试,提及诸多超参数,讲述超参数取值可通过画网格或立方体随机取值,还能从粗到细取值,学习率取值宜用对数标尺搜索。接着阐述 Batch 归一化,包括其原理、公式(计算均值、方差、归一化、尺度变换和偏移)及整合应用。最后介绍 Softmax 回归,说明其用于多分类问题,给出具体分类示例及 Softmax 激活函数的计算方式。
2025-02-01 23:07:52
958
原创 吴恩达深度学习——优化神经网络
文章介绍了神经网络中的优化方法。首先介绍优化样本大小的mini - batch方法,通过分割样本减少计算梯度的时间和内存开销,对比了不同mini - batch大小的梯度下降情况。接着介绍优化梯度下降法,包括动量梯度下降法(涉及指数加权平均与偏差纠正)、RMSprop以及结合两者的Adam优化算法。还提到了优化学习率,如学习率衰减的多种方式。最后介绍了局部最优问题,即梯度下降算法可能会在局部最优解处停止更新,不一定能找到全局最优解。
2025-02-01 15:58:15
1442
2
原创 吴恩达深度学习——有效运作神经网络
本人简要介绍了实操前深度学习的一些概念。首先介绍训练集、验证集、测试集的功能与划分比例,强调数据分布一致性的重要性。然后介绍偏差和方差,借助实例和图示阐释欠拟合、适度拟合、过拟合的差异。讲解正则化方法,如线性回归中的 L2 正则化及系数调整技巧,还介绍了 Dropout 等其他方式。此外,阐述了归一化的步骤及意义,说明梯度消失与爆炸的成因和权重初始化策略。最后,介绍梯度检验,包括数值逼近原理、操作步骤及使用建议。
2025-01-30 22:54:49
1384
2
原创 JVM 双亲委派模型
JVM获取到class文件后,就要通过类加载器把文件加载到内存的运行时数据区中。类的生命周期如下图所示。类加载用来负责class文件的加载,至于能不能执行,就不归它管。类加载包括三个过程:加载、连接(验证、准备、解析)、初始化。下面简单介绍类加载的过程做了什么事。:通过一个类的全限定名获取定义此类的二进制字节流,将该字节流所代表的静态存储结构转换为方法区的运行时数据结构,然后生成一个代表该类的反射对象,作为方法区的这个类的各种数据的访问入口。
2023-03-19 10:36:54
587
原创 Java 数据结构与算法 ArrayList扩容机制分析与LinkedList源码分析
简单分析了ArrayList的扩容机制和LinkedList部分源码
2022-10-30 22:09:16
411
Java 图书管理系统源码
2023-07-03
如图,输入数字num打印正方形,为什么两个程序的结果不一样?
2021-07-20
TA创建的收藏夹 TA关注的收藏夹
TA关注的人