
程序人生
文章平均质量分 86
人工智能-研究所
SCI/论文带读/本硕博毕业论文/中文核心期刊/EI会议/期刊/顶会发刊论文指导
文章相关资源可关注V.X【服务号】:AI技术星球 发送:211C 自取
展开
-
面试官必问:一文读懂VGG、GoogleNet、ResNet到底是什么?
VGG(Visual Geometry Group)是由牛津大学视觉几何组提出的深度卷积神经网络,它在 2014 年的 ImageNet 大规模视觉识别挑战赛(ILSVRC)中取得了优异的成绩。VGG 的主要贡献在于证明了增加网络的深度可以显著提高模型的性能,其网络结构简单且规整,具有很强的可扩展性。GoogleNet(也称为 Inception 网络)是由 Google 团队在 2014 年提出的深度卷积神经网络,它在 ImageNet 挑战赛中夺冠。原创 2025-05-15 16:52:06 · 279 阅读 · 0 评论 -
掌握反向传播:神经网络综合指南
反向传播算法于 1970 年代推出,是一种根据前一次迭代或纪元中获得的误差率微调神经网络权重的方法,这是训练人工神经网络的标准方法。你可以把它看作是一个反馈系统,在每一轮训练或 “纪元” 之后,网络都会审查其在任务上的表现。它计算其输出与正确答案之间的差异,称为错误。然后,它会调整其内部参数或 'weights' 以减少下次的误差。这种方法对于调整神经网络的准确性至关重要,并且是学习做出更好预测或决策的基础策略。原创 2025-05-14 22:21:43 · 683 阅读 · 0 评论 -
频上Nature中科院一区!?多尺度注意力,显著涨点效果与强大的启发性
今天要给大家分享一个极具潜力的创新点 ——多尺度注意力,凭借其显著的涨点效果与强大的启发性,近来在学术界热度持续飙升。在目标检测领域,多尺度特征融合技术发挥着关键作用。将浅层网络细腻的细节特征,与深层网络富含语义的特征相结合,让小目标和遮挡目标无所遁形,显著提升检测性能。医学影像分割领域亦是如此,借助多尺度特征融合,能够精准捕捉病灶区域形态的多样性以及边界的模糊性,极大提高分割精度,为医疗诊断提供有力支持。不过,当下这一领域仍存在诸多挑战。原创 2025-04-28 15:30:26 · 642 阅读 · 0 评论 -
八年经验告诉你,强化学习的顺序千万不要学反了!
强化学习入门需要系统性掌握基础概念、核心算法、工具平台和实践路径。原创 2025-04-27 11:18:46 · 503 阅读 · 0 评论 -
使用 BERT 进行自然语言处理:动手指南
什么是自然语言处理 (NLP)?了解什么是自然语言处理 (NLP) 并发现其实际应用,使用 Google BERT 处理文本数据集。自然语言处理 (NLP) 通过使用机器学习来指示文本的结构和含义,从而改善了人类和计算机相互交流的方式。借助自然语言处理应用程序,组织可以通过分析文本和提取更有意义的信息来改善客户体验,从而提高工作效率并降低成本。读研期间如何快速入门NLP?博士花17小时精讲Transformer+Huggingface+自然语言处理12大项目实战—HMM、贝叶斯算法、LSTM。原创 2025-04-18 20:10:45 · 862 阅读 · 0 评论 -
初学者如何入门PyTorch
PyTorch是当前最受欢迎的深度学习框架之一,其动态计算图、直观的API设计和强大的GPU加速能力使其成为科研与工程领域的首选工具。以下从核心概念到实践应用的全方位解析将帮助你快速掌握PyTorch的核心技术。【转行分享】35+职场人破局AI领域,真的可行!详细图可关助我的V.X【服务号】AI技术星球 发送:211C 自取学习路线+200G资料包PyTorch的基础数据结构是多维数组张量,支持CPU/GPU运算。与NumPy的ndarray不同,PyTorch张量支持自动微分(Autograd):原创 2025-04-18 19:51:49 · 1024 阅读 · 0 评论 -
什么样的偏好,才叫好的偏好?——揭秘偏好对齐数据的「三驾马车」大模型LLM
这可能表明,在追求复杂标注流程时,过多的人类要求引入了噪音,而使用简约的标注 Prompt 并利用标注模型的固有判断力,比使用复杂的标注 Prompt 更契合真实世界的偏好信号,这和 DeepSeek-R1-Zero 在 Zero-RL 过程中使用的简约 prompt 有着异曲同工之妙。因此我们研究了不同混合策略的影响。:如图 4(中)所示,在控制各组分数差距的分布一致的前提下,高分回复对(正样本分数≥8)在所有基准测试中都取得了最显著的性能,总体上比低分回复对(正样本分数<7)高出 +9.35。原创 2025-04-17 14:34:04 · 1099 阅读 · 0 评论 -
ICLR 2025 | 一行代码!FreDF频域损失稳定提升时间序列预测精度
时间序列中的自相关性指的是「序列在不同时间步之间的相关性」,在时间序列预测中,这种自相关性既存在于模型的输入序列(历史观测值之间的相关性),也存在于标签序列(不同步标签之间的相关性)。通过可视化预测序列发现,FreDF 生成的预测序列与真实标签序列之间的拟合度更高,能够更准确地捕捉到标签序列中的高频成分,同时抑制明显的噪声和异常波动。进一步,提出一种基于频域标签训练的新范式——FreDF,只需加入一行代码,即可在主流模型上实现预测精度的稳定提升。:第 t 时刻的标签不仅和输入有关,也和上一时刻的状态有关。原创 2025-04-17 14:26:17 · 688 阅读 · 0 评论 -
【转行分享】35+职场人破局AI领域,真的可行!
有学员反馈,老师在课堂上分享的实际项目案例,对理解和应用知识帮助巨大,感觉就像有了行业内的领路人。而且,现在报名还有超多福利!,在这个行业摸爬滚打多年,虽然积累了不少经验,但随着行业发展,他越发觉得遇到了职业瓶颈,晋升空间有限,每天重复着相似的工作,看不到未来的方向。💰 价格方面也很友好,考虑到大家的经济压力,提供了多种分期方式,像花呗、信用卡分期免息,还有咕泡专属教育分期,让你可以轻松无压力地开启学习之旅。如果你也像王俭一样,在 35 + 的年纪渴望突破职业瓶颈,想转行人工智能,那就别再犹豫啦!原创 2025-04-17 14:05:08 · 703 阅读 · 0 评论 -
一文搞懂自注意力(PyTorch)
自注意力机制是Transformer模型的核心组件,它允许模型在处理序列数据时,通过计算序列中不同位置元素之间的相关性得分,动态地调整对每个元素的关注程度,从而捕捉到序列内部的复杂依赖关系。自注意力机制(Self- Attention)是什么?自注意力机制能够动态地捕捉序列中不同位置元素之间的依赖关系,并根据这些依赖关系生成新的序列表示。它之所以被称为“自注意力”,是因为它在单一序列中通过计算序列元素之间的相互依赖关系来生成新的特征表示。这与传统的注意力机制有所不同,后者通常涉及两个序列之间的交互。自注意力原创 2025-04-16 19:36:18 · 541 阅读 · 0 评论 -
最强组合!随机森林和LSTM!进行时间序列预测
咱们今天和大家聊聊在机器学习和深度学习领域,(Random Forest)和(LSTM)各自在处理数据时具有独特的优势。那么,将两者结合可以发挥它们各自的优点,从而提升模型的性能~:随机森林能够通过集成多个决策树来提高泛化能力,减少过拟合。而LSTM擅长处理时间序列数据,通过在时间维度上捕捉长期依赖关系。将两者结合,可以利用随机森林的集成优势和LSTM的序列建模能力。:LSTM在时序数据中的表现非常优秀,但它可能会受到梯度消失和爆炸的影响。原创 2025-04-16 13:59:03 · 1111 阅读 · 0 评论 -
一文搞懂基于知识图谱的多模态推理
基于知识图谱的推理通常依赖于神经网络模型来捕捉图谱中的结构信息,这些模型通过前向传播过程进行推理预测。例如,采用基于图神经网络(GNN)的推理方法,特别是基于注意力机制的图卷积神经网络(Graph Attention Network,GAT),该方法通过计算实体之间的相似度并为它们分配相应的权重,从而推断出实体之间的关系。原创 2025-04-14 14:19:50 · 484 阅读 · 0 评论 -
一文搞懂多模态学习(多模态融合 + 跨模态对齐)
数据级融合是在预处理阶段将不同模态的原始数据直接合并,适用于高度相关和互补的数据场景。原创 2025-04-11 14:20:49 · 786 阅读 · 0 评论 -
时间序列预测,out!!Informer、TimesNet、TimeLLM
大佬Christoph Bergmeir的PPT讨论了多个时间序列模型的问题,讲了一些常见时间序列模型的问题以及一些trick:常见模型问题总结接下来是常见的深度学习时间序列模型存在的问题。。也是老生长谈的问题了,公开数据集杀疯了,一测一个sota;私有数据集上拉跨,一测一个不吱声。原创 2025-04-10 19:48:46 · 295 阅读 · 0 评论 -
新手小白如何快速入门深度学习
深度学习是机器学习的一个子集,通过构建多层神经网络模拟人脑的抽象和推理能力,特别擅长处理图像、语音、文本等非结构化数据。其核心优势在于自动特征提取能力,相比传统机器学习依赖人工设计特征,深度学习通过多层非线性变换自动发现数据中的隐藏规律。原创 2025-03-20 21:14:51 · 782 阅读 · 0 评论 -
YOLO遇到Transformer:天花板在哪?
YOLO与Transformer的融合在精度-效率平衡和复杂场景泛化上仍有提升空间,其天花板受限于硬件算力与算法创新的协同突破。当前最适配人群为需高精度检测且具备计算资源的工业与科研团队,而医疗与无人机领域是近期落地热点。原创 2025-03-19 19:40:53 · 492 阅读 · 0 评论 -
机器学习的分类有哪些常见的方式?监督学习、无监督学习
特点:将已学知识迁移到新任务(如用ImageNet预训练模型做医学图像分类)。通过组合不同分类方式,可灵活应对实际问题(如用生成模型做半监督分类)。特点:不假设数据分布,模型复杂度随数据量增长(如KNN、决策树)。特点:结合多个弱模型提升性能(如随机森林、XGBoost)。特点:利用数据自身构造监督信号(如BERT通过掩码预测学习)。特点:用极少量样本训练模型(如Meta-Learning)。特点:数据逐步输入,模型动态更新(如实时广告点击预测)。监督学习(Supervised Learning)原创 2025-03-13 20:11:16 · 807 阅读 · 0 评论 -
刚读研一,打算学YOLO目标检测,请问要怎么入门?
要系统学习YOLO(You Only Look Once)算法,需要从理论基础、编程实践、框架应用及项目实战四个维度展开。原创 2025-03-04 17:45:19 · 949 阅读 · 0 评论 -
AI书籍:强化学习的艺术:Python 第一版的基础、数学和实现
通过这份全面的指南,释放强化学习 (RL) 的全部潜力,这是人工智能的一个重要子领域。本书深入探讨了 RL 的核心概念、数学和实用算法,帮助您全面了解这项尖端技术。本书首先概述了马尔可夫决策过程、动态规划、蒙特卡洛方法和时间差异学习等基本概念,并使用清晰简洁的示例来解释 RL 理论的基础知识。以下部分介绍价值函数近似,这是 RL 中的一种关键技术,并探讨了各种策略近似,例如策略梯度方法和高级算法,如近端策略优化 (PPO)。原创 2025-03-03 20:55:54 · 474 阅读 · 0 评论 -
DeepSeek15天指导手册一从入门到精通
在自动驾驶领域,它通过深度视觉技术帮助汽车实时感知和理解环境,结合多模态数据融合技术,实现更安全、高效的自动驾驶。同时,DeepSeek的智能视频处理能力也在安防、应急指挥等领域发挥重要作用,通过高精度的目标检测和图像分割,提升公共安全水平。:DeepSeek展现出巨大潜力。:DeepSeek通过优化生产流程中的设备操作和维护,结合传感器数据实时监控生产线状态,有效提升了生产效率和产品质量。这些应用场景充分展示了DeepSeek大模型在不同领域的强大适应性和创新潜力,为各行各业的智能化转型提供了有力支持。原创 2025-02-11 13:46:07 · 422 阅读 · 0 评论 -
使用ppo算法解决两足机器人的步行问题,该从什么开始学呢?
通过以上步骤,从基础理论到实践案例,逐步掌握使用PPO算法解决两足机器人步行问题的关键技术和实现方法。结合仿真平台和现有工具,进行实践操作,进一步深化理解和应用能力。2024年零基础AI学习路线部分新增内容。原创 2024-12-26 17:01:14 · 1047 阅读 · 0 评论 -
机器学习中有哪些形式简单却很巧妙的idea?
在机器学习领域,有许多形式简单却非常巧妙的想法(idea)。这些想法往往能够在保证算法简洁性的同时,解决复杂的问题。下面列出了一些典型的例子:原理:Isolation Forest通过递归地将数据空间分割成子空间,来识别异常点。异常点通常更容易被孤立,因为在空间中与其他点的距离更远。通过构建多棵随机分割的二叉树(隔离树),那些在少数几步分割中就被孤立的点更可能被标记为异常点。 应用场景:异常检测在金融欺诈识别、网络安全等领域有着广泛应用。 原理:Word2Vec通过训练神经网络来预测词语在句子中的出现概率原创 2024-12-19 16:51:20 · 972 阅读 · 0 评论 -
硕士论文写YOLO可以毕业吗?
YOLO算法是一种革命性的目标检测方法,它巧妙地将复杂的问题转化为简单的回归任务。通过,每个网格负责预测位于其中心的目标,实现了端到端的目标检测。这种方法不仅简化了问题,还显著提升了检测速度。YOLO的核心创新在于,无需额外的候选区域生成步骤。这种统一的框架使得YOLO能够在保证较高准确率的同时,实现极高的检测速度,成为实时目标检测领域的里程碑式算法。YOLO算法自2016年问世以来,经历了多个重要版本的演进,不断推动着实时目标检测技术的进步。以下是各版本的主要特点和发展时间线:YOLOv6。原创 2024-12-07 17:00:14 · 1563 阅读 · 0 评论 -
行为识别:基于3D卷积的视频分析与动作识别,Openpose、姿态估计
3D卷积是一种扩展自2D卷积的技术,专门设计用于处理三维数据。它在三个维度上操作,特别适用于处理视频或医学影像等三维数据。其核心思想是在输入数据上滑动一个三维卷积核,执行元素乘法并求和,生成新的三维输出数据块。这一过程可以用数学公式表示为:其中,I代表输入数据,K代表卷积核,O代表输出数据。这种操作使3D卷积能够有效捕捉时空特征,为后续的高级视觉任务提供强大支持。在深度学习领域,2D卷积和3D卷积都是处理图像和视频数据的重要工具,但它们在原理和应用上有显著差异。原创 2024-12-03 15:44:51 · 955 阅读 · 0 评论 -
注意力机制中生成的类似热力图或者柱状图是如何生成的
注意力机制是深度学习中的一种关键机制,模拟人类视觉系统的聚焦功能。它通过评估元素间相关性并分配权重,使模型能专注于处理最相关信息。这一机制不仅提高了模型效率,还增强了其解释性。在自然语言处理和计算机视觉等领域,注意力机制已成为提升模型性能的重要工具,尤其在处理序列数据时表现突出。通过引入注意力机制,模型能在复杂的输入数据中快速定位关键信息,实现更精准的任务执行。原创 2024-11-27 18:47:23 · 1709 阅读 · 0 评论 -
一文详解缺陷检测
缺陷检测是指通过各种技术手段,对工业产品的表面或内部进行检测,以识别出可能存在的缺陷,如裂纹、划痕、污渍、尺寸偏差等。随着科技的发展,缺陷检测技术也在不断进步,从传统的人工检测逐渐向智能化、自动化的检测方式转变。缺陷检测技术在多个行业中扮演着至关重要的角色,尤其在和中表现突出。在制造业中,该技术广泛应用于,如识别金属零件的划痕、涂层瑕疵等。同时,在方面也发挥着重要作用,确保产品符合严格的标准。在电子产业中,特别是制造方面,缺陷检测技术更是不可或缺。它能有效识别PCB上的各种缺陷,如。原创 2024-11-15 16:47:45 · 2159 阅读 · 1 评论 -
研究生如何写YOLO方面的论文
对于特定研究需求,可能需要构建自定义数据集。这涉及图像采集、标注和数据清洗等工作。在构建过程中,应注意保持数据的多样性和代表性,以确保模型的泛化能力。原创 2024-11-15 14:46:51 · 2594 阅读 · 0 评论 -
大模型+强化学习(PPO算法、RLHF、DPO技术)
大模型是人工智能领域的重要突破,代表了机器学习模型向更大规模、更强能力发展的趋势。这些模型通常具有。原创 2024-11-12 16:06:24 · 3764 阅读 · 0 评论 -
OpenCV停车场车位检测详解
综合以上讨论,基于OpenCV的停车场车位检测技术通过一系列图像处理和机器学习算法,实现了高效的车位识别。传统方法如SVM和LBP在特定环境下表现良好,但在复杂场景中存在局限。深度学习特别是CNN和YOLOv5的应用,大大提高了系统的实时性和鲁棒性,能够应对各种复杂环境。未来的研究方向将继续围绕如何提升低质量图像的识别率、增强模型的泛化能力和优化计算效率展开。原创 2024-11-08 14:12:16 · 1653 阅读 · 0 评论 -
3D点云原理及应用
3D点云是。原创 2024-11-08 13:42:03 · 2418 阅读 · 0 评论 -
一文了解机器学习算法原理及应用(回归算法、神经网络、聚类算法...)
机器学习是人工智能领域的核心技术之一,它通过。原创 2024-11-05 11:31:53 · 1716 阅读 · 0 评论 -
如何使用 PyTorch 构建具有真实数据集的神经网络,使用 FitBit Fitness Tracker 数据集构建和训练神经网络的分步指南
现在,我们将开始从 PyTorch nn.模块。没有特定的规则来规定层数和每层中的节点数。通常,需要多轮反复试验才能找到有效的正确数字。一条经验法则是,网络应该足够小以便快速处理,并且应该足够大以高精度解决预期问题。我们的模型由 3 层、3 个激活函数和 1 个输出层组成。1、模型的第一层。原创 2024-10-29 16:56:31 · 650 阅读 · 0 评论 -
ICML 2024 顶级论文:机器学习领域的新变化
最佳论文奖获得者今年的决议之一是分享来自领先 AI 会议的论文,以了解最新更新。这些场合通常是 ML 和计算机视觉等领域的趋势和创新出现的地方。此外,夏季是理想的时间,因为在此期间会举办许多此类活动。ICML 是机器学习国际会议,目前正在奥地利首都维也纳举行。与每年一样,与其他顶级 AI 会议一样,提交了数千篇论文,接受率相对较低(过去三年不到 28%)。例如,今年的版本提交了 9,653 篇论文,仅接受 2,609 篇,接受率为 27.03%。原创 2024-10-29 11:29:10 · 2202 阅读 · 0 评论 -
在 PyTorch 中实现 Vision Transformer 分类器
我决定研究常规变压器的扩展:视觉变压器。顾名思义,这种类型的 transformer 将图像作为输入,而不是单词序列。本博客将概述 Vision Transformer 的架构,并在 CIFAR100 数据集上实现基于 Vision Transformer 的分类器。顾名思义,视觉转换器是应用于图像数据的转换器。它们通常是基于编码器的,这意味着不需要自注意力掩码。每个查询向量都可以使用每个关键向量来生成注意力权重。与文本序列不同,图像天生不适合输入到 transformer 中。原创 2024-10-26 15:19:24 · 1278 阅读 · 0 评论 -
使用 PyTorch 深入了解图神经网络:简单指南
想象一下你有一个朋友网络。每个朋友 (节点) 都有特定的特征,而友谊 (边缘) 将它们连接起来。GNN 通过查看每个朋友的特征以及他们的联系方式来帮助我们了解这个网络。把它想象成根据谁认识谁和他们的个性来弄清楚谁受欢迎。GNN 类似于卷积神经网络 (CNN),但它们不是处理图像,而是处理图形 — 互连点的网络。它们通过在节点之间传递消息来学习,根据每个节点的邻居更新他们对每个节点的理解。原创 2024-10-26 14:43:59 · 680 阅读 · 0 评论 -
还是原装Transformer好!北大清华团队同时揭示Mamba等推理短板
然而,输出序列的可能性指数级增长,这使得这些架构无法以较小的模型尺寸正确生成所有可能的输出。来自清华的研究团队则在 Mamba 和 Transformer 上使用判定图是否为树的任务进行训练,表明 Transformer 结构在此问题上相比于 Mamba 所具有的显著优势,以及在 RNN 上使用上下文检索对性能的影响。同时,他们的实验结果也表明了良好的推理局部性(下图右列)能够增强多种 Efficient Transformers 的思维链推理能力,表现在使用相同尺寸的模型时能够解决规模更大的推理任务。原创 2024-10-24 16:36:23 · 532 阅读 · 0 评论 -
时间序列预测原理、方法、应用案例
例如,Evolutionary attention-based LSTM(EA-LSTM)通过进化计算启发的竞争随机搜索方法配置注意力层参数,提高了模型的泛化能力和预测精度。:分布式光伏电站的发电量受天气和地理位置的影响较大,通过融合多种时间序列特征和模型(如M2E-DPV模型),可以提高中长期预测的准确性。时间序列数据的核心对象是序列中的数据点,按时间递增排序,即按时间的自然顺序排列。:通过引入核函数(如径向基函数RBF),SVM能够有效地处理复杂的非线性关系,这对于许多现实世界的时间序列数据尤为重要。原创 2024-10-22 17:02:14 · 1899 阅读 · 0 评论 -
没数据?不做实验?临床医生如何发文章?
1、优点:认可度比较高,除某些特殊要求外,不需要学习特定的软件。2、缺点:疾病种类有限,大样本的数据能够帮我们获得更加可靠的结论,同时也能提高文章的档次,认可度很不错。不过,遗憾的是,目前相关的数据库并不是很多。原创 2024-10-18 17:31:20 · 1173 阅读 · 0 评论 -
一文了解深度学习模型:CNN、RNN、GAN、transformer
深度学习是一种模仿人脑神经网络结构和功能的机器学习方法,通过构建多层神经网络模型,自动从大规模数据中学习复杂的特征表示。其核心原理包括和层次化特征提取:通过多层非线性变换,逐步提取数据的高级语义特征端到端学习:直接学习输入与输出间的映射关系,无需人工干预这种机制使深度学习能有效处理高维、非线性数据,在图像识别、语音识别和自然语言处理等领域展现出卓越性能。原创 2024-10-17 17:22:18 · 9650 阅读 · 0 评论 -
什么是Transformers?详解“Attention is All You Need” — Transformer 架构
尽管围绕等生成使用如 GPT、BERT、Cohere、LLAMA、Mistral 等)的所有嗡嗡声,看看影响这一切的工作至关重要。💡让我们深入了解变形金刚的世界——不,不是来自外太空的变形机器人(撇开这个愚蠢的笑话不谈)——而是自然语言处理 (NLP) 领域的底层模型,它改变了机器理解和生成类似人类文本的方式。让我们从了解开始。准备了一份人工智能入门到进阶的学习攻略包,还有一份论文攻略包。需要哪个可以看下图获取。原创 2024-10-10 15:02:49 · 1063 阅读 · 0 评论