洛华363-CSDN博客

原创 transformer结构

序列建模是自然语言处理（NLP）、语音识别、时间序列预测等领域的核心任务，其目标是学习输入序列（如一句话）中元素之间的依赖关系，并据此生成输出（如下一句话、翻译结果等）。其核心特点是：当前输出不仅依赖当前输入，还依赖历史输入（或未来输入）。下图为seq2seq形式的序列建模任务在 Transformer 出现之前，循环神经网络（RNN）及其变体（如 LSTM、GRU）是处理序列建模任务的主流方法。它们通过“循环”结构逐个处理序列中的元素，并维护一个隐藏状态来传递历史信息。然而，

2025-10-28 23:34:52 562

原创 yolo学习笔记02——yolo简介

YOLO系列是一种革命性的实时目标检测算法，其核心思想是将检测任务视为回归问题，通过单次图像处理完成物体识别与分类。YOLOv1首次提出将图像划分为网格进行预测，但其存在定位精度低、小物体检测效果差等问题。YOLOv2（YOLO9000）引入DarkNet-19主干网络，支持多尺度训练，能检测9000个类别。该系列采用Backbone-Neck-Head结构，通过端到端优化实现高效检测，虽然速度快但存在召回率低等缺点。后续版本不断改进网络结构和损失函数，在速度和精度间取得平衡。

2025-09-11 19:29:58 1192

原创 yolo学习笔记01——前置基础

本文介绍了计算机视觉中图像识别的三大任务：目标检测、图像分类和图像分割，重点分析了目标检测技术。目标检测需要识别物体类别并定位其位置，主要分为单阶段（如YOLO）和双阶段（如R-CNN）两种方法，前者速度快但精度较低，后者反之。文章详细阐述了目标检测的核心评估指标：交并比（IoU）衡量预测框与真实框的重合度，置信度反映模型对预测结果的信心程度，以及mAP通过PR曲线综合评估模型性能。这些技术在自动驾驶、安防监控、医疗影像等领域具有广泛应用。

2025-08-28 17:11:08 1077

原创初识RNN02——RNN基础

摘要：本文介绍了循环神经网络(RNN)的基本原理与应用。首先解释了传统全连接神经网络在处理序列数据时的局限性，进而引出RNN的必要性。RNN通过引入隐藏状态来记忆历史信息，能够有效处理文本、语音等具有时间顺序的数据。文章详细分析了RNN的结构原理，包括输入层、隐藏层和输出层的数学表达，并提供了PyTorch实现代码。最后，对RNN中batch size、序列长度、输入/输出维度等重要参数进行了详细说明，特别是隐藏层大小的选择策略及其对模型性能的影响。

2025-08-25 20:22:26 1247

原创初识RNN01——NLP基础

自然语言处理（NLP）是人工智能的重要分支，旨在让计算机理解、处理和生成人类语言。其核心流程包括语料获取、预处理、特征工程、模型构建与训练等。NLP研究方向涵盖语言理解（如情感分析、信息检索）、语言转换（如机器翻译、语音识别）和语言生成（如文本生成、语音合成）三大领域。关键技术包括词嵌入、序列建模、神经网络等，经历了从规则方法到统计学习再到深度学习的演进。随着Word2Vec、Seq2Seq等模型的突破，NLP在机器翻译、智能对话等场景展现出强大能力。中文NLP还需特别处理分词、语法等独特挑战。

2025-08-22 17:20:00 1294

原创初识CNN05——经典网络认识2

本文介绍了两种经典CNN网络架构：GoogleNet和ResNet。GoogleNet通过Inception模块实现多尺度特征提取，利用1x1卷积进行通道降维，并引入辅助分类器缓解梯度消失。ResNet创新性地提出残差结构，通过跳跃连接解决深层网络梯度消失问题，使训练超百层网络成为可能。两种架构都通过特殊结构设计显著提升了网络性能，为深度学习发展做出重要贡献，其中GoogleNet获得2014年ImageNet冠军，ResNet则成为后续网络设计的基础范式。

2025-08-19 22:11:26 886

原创初识CNN04——经典网络认识

本文简要介绍了三种经典神经网络——LeNet5、AlexNet、VGGNet，以及其各自在CNN的发展中所做出的贡献。

2025-08-18 19:15:05 1390

原创初识CNN03——预训练与迁移学习

本文介绍了计算机视觉数据集处理与训练可视化的完整流程。首先将数据集分为图像分类（如ImageNet）和密集标注（如COCO）两类，详细说明其标注形式和特点。然后介绍了多种数据集来源，包括开源平台、外包采集等，并提供了将PyTorch数据集本地化为图片的Python代码。接着重点讲解了使用TensorBoard进行训练过程可视化的方法，包括安装配置、记录训练曲线、可视化模型结构、监控参数分布等。最后简要提及了将模型预测结果导出为Excel进行分析的方法。文章提供了丰富的代码示例和实用技巧，为计算机视觉实践提供

2025-08-17 21:44:48 1582

原创初识CNN02——认识CNN2

摘要：本文介绍了卷积神经网络(CNN)的扩展知识，包括反卷积、膨胀卷积、可分离卷积等特殊卷积操作，以及感受野概念。反卷积用于上采样，膨胀卷积扩大感受野，可分离卷积减少计算量。文章还给出了一个图像分类的CNN模型实现，包含卷积层、ReLU激活、池化和Dropout等组件。通过分析不同卷积方式的数学原理和可视化过程，帮助读者深入理解CNN的特征提取机制。

2025-08-15 19:54:30 1313

原创初识CNN01——认识CNN

卷积神经网络（CNN）是一种专门处理网格状数据（如图像）的深度学习模型，主要由卷积层、池化层和全连接层构成。卷积层通过局部连接和权重共享自动提取图像特征，池化层降低计算量并增强特征，全连接层输出结果。相比全连接网络，CNN能更好保留图像空间结构，广泛应用于计算机视觉、医疗影像、自动驾驶等领域。核心计算包括多通道卷积、padding保持尺寸、stride控制滑动步长等，通过调整卷积核参数提取不同层次特征。PyTorch等框架提供了便捷的卷积操作API，支持灵活配置输入输出通道、核大小等参数。

2025-08-14 19:06:47 1507

原创初识神经网络05——构建神经网络3

神经网络中的过拟合与欠拟合问题摘要：本文介绍了神经网络中的过拟合和欠拟合问题及其解决方案。欠拟合通常表现为训练和测试误差均较高，可通过增加模型复杂度、添加特征或减少正则化强度来解决。过拟合表现为训练误差低但验证误差高，主要解决方法包括三种正则化技术：L2正则化通过惩罚权重平方和限制模型复杂度；L1正则化通过绝对值惩罚实现特征选择和稀疏性；Dropout随机丢弃神经元以增强模型泛化能力。文章对比了这些方法的数学原理和实际应用效果，为优化神经网络提供了实用指导。（字数：149）

2025-08-13 20:18:09 1595

原创初识神经网络04——构建神经网络2

本文介绍了神经网络参数初始化的几种常见方法及其原理。首先分析了固定值初始化（全0、全1、任意常数）的局限性，特别是对称性问题。随后重点讲解了两种自适应初始化方法：Xavier初始化（适用于Sigmoid/Tanh激活函数，通过平衡输入输出维度保持方差一致性）和He初始化（专为ReLU设计，考虑激活函数特性调整方差）。文章通过数学推导展示了这些方法的理论基础，并指出PyTorch默认使用He初始化权重、均匀分布初始化偏置。不同初始化方式对模型训练效果有显著影响，选择合适的初始化方法是深度学习实践中的重要环节。

2025-08-12 21:43:07 1223

原创初识神经网络03——构建神经网络

本文介绍了PyTorch中神经网络的基本组件与数据处理方法。主要内容包括：1) 线性层组件nn.Linear和顺序容器nn.Sequential的使用；2) 常见激活函数(sigmoid、ReLU等)及其作用；3) 回归和分类任务中的损失函数选择；4) 优化器(SGD、Adam等)的核心方法。在数据处理部分，详细讲解了Dataset类的实现方法、TensorDataset类的便捷使用，以及DataLoader的批量加载功能。文章为PyTorch初学者提供了神经网络构建和数据处理的基础知识，并附有官方文档链接

2025-08-11 20:15:26 1237

原创初识神经网络02——认识神经网络

深度学习是机器学习的一个子领域，基于多层神经网络（尤其是深度神经网络）构建模型，能够从大规模数据中自动学习复杂的特征表示。其核心是通过多层次的非线性变换，逐层提取数据的高层抽象特征，广泛应用于图像识别、自然语言处理、语音识别等领域。神经网络是一种模仿生物神经元结构的计算模型，由大量相互连接的节点（神经元）组成。每个神经元接收输入信号，通过加权求和与非线性激活函数处理后输出。神经网络的核心能力是通过调整连接权重（参数）来拟合输入与输出之间的复杂关系。

2025-08-07 20:03:54 1294

原创初识神经网络01——认识PyTorch

PyTorch基础与Tensor操作摘要 PyTorch是由Facebook开发的Python深度学习框架，以灵活高效著称，广泛应用于计算机视觉、自然语言处理等领域。其核心数据结构Tensor（张量）支持多维数组运算，可在GPU上加速运行。Tensor有三种主要数据类型（浮点、整数、布尔）和多种精度（8/16/32/64位）。创建Tensor的两种主要方式： torch.tensor()：根据输入数据自动推断类型 torch.Tensor()：默认创建float32类型张量 Tensor重要属性包括： d

2025-08-06 21:09:24 1367

原创机器学习05——正则化与逻辑回归

本文简要介绍了机器学习中的三种训练策略，其中最常用的还是MBGD。此外海讲解了梯度下降法的一种优化策略，即针对过拟合而使用的正则化。最后还讲解了逻辑回归。

2025-08-04 20:21:53 1371

原创机器学习04——初识梯度下降

在机器学习中，**梯度表示损失函数对于模型参数的偏导数**。具体来说，对于每个可训练参数，**梯度告诉我们在当前参数值下，沿着每个参数方向变化时，损失函数的变化率**。通过计算损失函数对参数的梯度，梯度下降算法能够根据梯度的信息来调整参数，朝着减少损失的方向更新模型，从而逐步优化模型，使得模型性能更好。

2025-08-01 17:07:06 1125

原创机器学习03——数据与算法初步2

本文介绍了决策树的基本概念及其在机器学习中的应用。决策树通过树状结构进行决策，具有可视化、易解释等优点，但也存在过拟合风险。重点讲解了两种决策树构建方法：信息增益和基尼指数。信息增益通过计算信息熵变化选择最优划分属性，而基尼指数则通过测量数据集不纯度进行划分。文中通过贷款预测和工资分类案例详细演示了这两种方法的具体计算过程。最后提供了Python代码示例，展示如何使用sklearn库实现决策树分类，包括数据加载、模型训练、评估和可视化。决策树作为一种基础算法，在分类问题中具有重要应用价值。

2025-07-31 21:40:26 1170

原创机器学习02——数据与算法初步

本文介绍了机器学习中的数据降维方法和KNN算法。数据降维包括特征选择（如低方差过滤和相关系数分析）和主成分分析(PCA)，用于减少计算成本并提高模型性能。KNN算法是一种基于距离的分类方法，通过计算样本与邻居的距离进行分类预测。文章还介绍了机器学习预估器的使用流程，包括实例化对象、模型训练和预测评估等步骤。这些方法可帮助简化数据特征，提高模型效率和准确性。

2025-07-30 19:26:13 1156

原创机器学习01——初识机器学习

机器学习入门指南与scikit-learn实践本文系统介绍了机器学习的基本概念和应用方法。首先概述了机器学习定义和发展历史，将其分为监督学习、半监督学习、无监督学习和强化学习四大类，并列举了各类典型算法。随后详细阐述了机器学习的五大开发步骤：数据收集、数据准备、模型训练、评估和性能优化。文章重点介绍了Python机器学习工具scikit-learn的安装与使用方法，包括内置数据集（如鸢尾花数据集）和在线数据集的操作技巧。通过具体代码示例，展示了如何加载数据集并获取特征数据、目标值等关键信息。本文为机器学习

2025-07-30 08:00:00 1456

原创初识opencv05——图像预处理4

该文章摘要介绍了OpenCV中直方图的基本操作与应用。主要内容包括：直方图的基本概念与绘制方法，展示了如何统计图像像素分布并可视化各通道（BGR）的直方图；直方图均衡化的原理与实现，通过调整像素分布改善图像对比度；对比度受限的自适应直方图均衡化（CLAHE），通过局部处理解决传统方法导致的过度增强问题；提供了相关API（如calcHist）的使用说明和代码示例，并对比了不同处理方法的视觉效果。文章通过示例代码和效果图直观展示了图像预处理技术的应用场景和优化效果。

2025-07-28 21:49:05 1366

原创初识opencv04——图像预处理3

本文介绍了OpenCV图像处理基础，重点讲解图像梯度处理和边缘检测技术。主要内容包括：1）图像梯度概念，通过差分计算像素值变化；2）边缘提取方法，使用自定义卷积核进行水平和垂直边缘检测；3）Sobel算子应用，计算x/y方向梯度并合成总梯度；4）Laplacian算子原理，基于二阶导数检测边缘；5）Canny边缘检测流程，包含高斯滤波预处理和梯度计算。文章通过代码示例演示了filter2D、Sobel和Laplacian等核心API的使用，展示了不同算子提取边缘的效果对比，为图像处理初学者提供了基础实践指导

2025-07-25 21:43:03 1302

原创初识opencv03——图像预处理2

OpenCV图像插值算法详解本文详细介绍了OpenCV中常用的六种图像插值算法，包括最近邻插值、双线性插值、像素区域插值、双三次插值、Lanczos插值等。通过数学公式和图示，深入浅出地讲解了各算法的原理和实现方式，并对比了它们的邻域大小、计算复杂度、视觉质量等特性。文章还提供了目标图像与原图像坐标的转换公式，解释了在图像缩放、旋转等变换时为何需要插值算法。最后通过表格形式对比了各算法的优缺点和适用场景，为读者选择合适算法提供了参考依据。

2025-07-24 22:57:01 1440

原创初识opencv02——图像预处理1

本文介绍了OpenCV的基本图像处理操作，包括图像变换和色彩空间转换。主要内容有：1）图像翻转操作（水平、垂直及同时翻转）及其API使用；2）仿射变换原理与实现，涵盖旋转、平移、缩放和剪切等线性变换；3）图像叠加方法及其注意事项；4）RGB色彩空间的基础知识。文章通过数学矩阵公式和Python代码示例，详细讲解了各种图像处理技术的实现原理和OpenCV函数的具体应用。

2025-07-23 20:32:02 1057

原创初识opencv01——基本api操作

本文介绍了OpenCV-Python的基本使用方法，主要包括计算机中图像的构成、存储方式以及基本图像操作。文章首先讲解了图像的像素、通道和尺寸概念，指出彩色图像由RGB三通道组成，每个像素值范围0-255。随后详细介绍了OpenCV中的图像读取、显示、创建和保存操作，包括常用API如cv2.imread()、cv2.imshow()等。此外还演示了如何在图像上绘制文字和基本图形（直线、圆形、矩形）。文章通过代码示例展示了OpenCV-Python在图像处理中的基础应用，为计算机视觉开发提供了入门指导。

2025-07-22 22:15:18 1178

原创 python基础语法复习08——模块化编程

本文介绍了Python模块化编程的基础知识。主要内容包括：1）模块的定义与使用，涵盖系统模块、第三方模块和自定义模块的创建与导入方式；2）包的概念与结构，说明如何通过目录和__init__.py文件组织多个模块；3）模块与包的区别，并提供了常用系统模块和第三方模块的示例。文章还详细解释了__init__.py文件的作用，包括标识包目录、执行初始化代码以及控制导入行为等功能。适合Python初学者系统学习模块化编程的基本概念和实践方法。

2025-07-18 18:49:05 1128

原创 python基础语法复习07——迭代器与生成器

本文介绍了Python中迭代器和生成器的核心概念与使用方法。迭代器通过实现__iter__()和__next__()方法实现惰性求值，适合自定义复杂迭代逻辑；生成器则通过yield关键字自动实现迭代协议，代码更简洁。两者都支持惰性计算，但生成器更适用于大数据处理和流式计算。文章对比了它们的特性差异，并建议根据实际需求选择：需要精细控制迭代过程时用迭代器，追求简洁高效时优先使用生成器。合理使用这两大工具可以显著提升Python程序的性能和开发效率。

2025-07-17 18:48:31 1144

原创 python基础语法复习06——类与对象

本文介绍了Python面向对象编程的核心概念，包括类与对象、属性与方法。主要内容包括：1. 类与对象的基本概念，类作为模板和对象作为实例的关系；2. 实例属性和类属性的定义与使用；3. 实例方法和类方法的定义与调用方式。文章通过学生类、银行账户等示例展示了如何定义类、创建对象，并详细说明了不同属性的访问方式以及实例方法和类方法的区别与适用场景。最后还提到了Python类可以动态修改属性的特性。

2025-07-16 19:26:10 1193

原创 python基础语法复习05——递归及装饰器

本文介绍了Python中的递归和装饰器两大核心概念。递归部分阐述了其定义、基本结构和注意事项，并通过阶乘计算示例展示了递归的实现方式。装饰器部分详细讲解了其原理、基本结构、链式调用、参数处理和类装饰器实现，并分析了装饰器在权限校验、日志记录等场景的应用价值。文章强调递归需要设置终止条件避免无限循环，装饰器则遵循闭包思想实现功能扩展，两者都是Python编程中的重要技术点。通过代码示例直观展示了它们的使用方法和实际应用场景。

2025-07-15 18:33:58 1131

原创 python基础语法复习04——函数

本文介绍了Python函数的基础知识，包括函数定义、调用方式以及多种参数传递方法。主要内容涵盖：1)函数的基本定义与调用语法；2)位置传参和关键词传参；3)参数默认值的设置；4)可变参数(*args和**kwargs)的使用；5)参数解包技巧；6)值传递与引用传递的区别；7)可变对象的拷贝方法。文章强调函数在代码复用和模块化中的重要性，建议通过实践项目加深理解。这些基础概念对提升Python编程能力至关重要，适合初学者系统学习函数的使用方法。

2025-07-14 18:39:20 1453

原创 python基础语法复习03——语句及其构成

本文介绍了Python基础语法中的核心概念，包括：1)运算符的特殊用法(and/or/not、三目运算符)；2)表达式中的推导式和lambda表达式；3)控制结构(条件语句if/elif/else和match-case、循环语句for/while)；4)异常处理机制(try-except-finally/raise/assert)；5)补充内容(import和with语句)。文章通过代码示例详细说明了各种语法结构的用法，为Python初学者提供了全面的语法基础参考。

2025-07-11 16:50:05 1101

原创 python基础语法复习02——复合类型

本文介绍了Python中三种常用的复合数据类型：列表(list)、元组(tuple)和字典(dict)。列表是可变的序列容器，支持索引、切片、增删改查等操作；元组是不可变的序列，常用于存储有序数据；字典是键值对的映射容器，通过键快速查找值。文章详细讲解了每种类型的基本操作、创建方法、访问方式和常用函数，帮助读者掌握这些核心数据结构的使用。这些复合类型在Python编程中广泛应用，是处理复杂数据的重要工具。

2025-07-10 19:50:18 1348

原创 python基础语法复习01

以上就是今天的python中的基础语法复习，本文仅仅简单介绍了python的基本数据类型，主要为字符串以及数字类型。

2025-07-09 17:57:55 1399

原创如何在Pycharm中使用Anaconda进行环境管理

PyCharm中使用Anaconda环境的操作指南本文介绍了在PyCharm中配置和管理Anaconda环境的基本操作。适用场景有：创建项目时选择已有conda环境，修改已有项目的环境。

2025-07-09 11:52:42 495

原创基于Anaconda的python虚拟环境创建与使用

本文介绍了Anaconda环境管理的基本操作。主要内容包括：1）启动Anaconda Prompt；2）环境查看(conda env list)、创建(conda create)、切换(conda activate)；3）包管理(conda install/uninstall)；4）环境删除(conda remove)和迁移(conda env export/import)。特别说明了如何创建指定Python版本的环境，以及处理conda和pip安装的包迁移问题。文章通过命令行示例详细展示了各操作步骤

2025-07-08 20:16:12 1222 2

qq_73960031的博客