心爱心爱-CSDN博客

原创 Attention Is All You Need 论文精读

主流的序列转导模型基于复杂的递归或卷积神经网络，包括编码器和解码器。性能最好的模型还通过注意力机制连接编码器和解码器。我们提出了一种全新且简单的网络架构——Transformer，它完全基于注意力机制，彻底摒弃了循环和卷积。在两项机器翻译任务上的实验表明，这些模型在质量上更胜一筹，同时具备出色的并行性，训练耗时也大幅减少。在WMT 2014 英德翻译任务中，我们的模型达到了28.4的BLEU值，超越了包括集成模型在内的现有最优结果，BLEU值提高了2个点。

2025-05-29 17:26:57 776

原创 Masked Autoencoders for Point Cloud Self-supervised Learning 论文精读

本文提出了一种简洁高效的点云自监督学习掩码自编码器方案Point-MAE。该方法通过将输入点云划分为不规则点块并进行高比例随机掩码，基于标准Transformer构建非对称自编码器（编码器仅处理未掩码点块，轻量级解码器重建掩码部分），有效解决了点云掩码自编码中的关键挑战：骨干网络架构统一问题、位置信息过早泄露问题以及信息密度不均匀问题。实验表明，Point-MAE在ScanObjectNN和ModelNet40上分别达到85.18%和94.04%的分类准确率，超越所有自监督学习方法，甚至优于专门设计的监督学

2025-05-27 21:56:35 1140

原创 Towards High-resolution 3D Anomaly Detection via Group-Level Feature Contrastive Learning 论文精读

本文提出了一种基于组级特征对比学习的高分辨率三维异常检测方法Group3AD。针对高分辨率点云异常检测面临的三大挑战：数据量大导致信息捕捉困难、特征表示各向异性以及异常区域比例小难以刻画，本文设计了簇间一致性网络(IUN)和簇内对齐网络(IAN)来优化特征空间分布，并提出基于几何信息的自适应组中心选择(AGCS)方法提升异常区域检测敏感性。实验表明，Group3AD在Real3D-AD数据集上对象级AUROC指标比Reg3D-AD提高5%，有效提升了高分辨率三维异常检测的性能。该方法可直接应用于各种网络架构

2025-05-26 17:11:34 857

原创 PO3AD: Predicting Point Offsets toward Better 3D Point Cloud Anomaly Detection 论文精读

本文提出了一种新颖的PO3AD框架，用于三维点云异常检测。该方法通过预测伪异常样本中的点偏移量，使模型能够专注于信息丰富的伪异常区域，从而更有效地学习正常数据表示。与现有基于重建的方法不同，PO3AD仅需估计正常点的偏移量大小，同时预测伪异常点的偏移量大小和方向，避免了对正常点和伪异常点赋予相同权重导致的问题。此外，作者设计了一种法向量引导的异常模拟方法Norm-AS，用于生成更真实的伪异常样本。在Anomaly-ShapeNet和Real3D-AD数据集上的实验表明，PO3AD显著优于现有方法，检测AUC

2025-05-25 17:19:18 587

原创 CVPR 2025 名字里带 Anomaly 的论文合集（未发布的论文后续会更新）

CVPR 2025 名字里带 Anomaly 的论文合集（未发布的论文后续会更新）异常检测+二维+三维+多模态+视频+新数据集

2025-05-24 18:38:19 854

原创 Complementary Pseudo Multimodal Feature for Point Cloud Anomaly Detection 论文精读

本研究提出了一种名为互补伪多模态特征（CPMF）的方法，用于提升点云异常检测的性能。CPMF通过结合手工制作的点云描述符和预训练的二维神经网络，分别捕捉点云的局部几何信息和全局语义信息。具体而言，CPMF将原始点云投影为多视图图像，利用预训练二维神经网络提取语义特征，并将其与三维模态特征聚合，形成互补的多模态特征。实验结果表明，CPMF在MVTec3D基准测试中取得了显著的成绩，证明了其在点云异常检测中的有效性。代码已开源，供进一步研究和应用。

2025-05-21 19:13:19 1082

原创 ECCV 2024 名字里带 Anomaly 的论文合集

ECCV 2024 名字里带 Anomaly 的论文合集视频异常检测二维异常检测三维异常检测多模态异常检测异常合成医学图像异常检测

2025-05-20 18:22:40 1318

原创 CVPR 2024 名字里带 Anomaly 的论文合集

CVPR 2024 名字里带 Anomaly 的论文合集:视频异常检测+二维+三维+多模态

2025-05-18 21:59:08 825

原创 Real3D-AD: A Dataset of Point Cloud Anomaly Detection 论文精读

高精度点云异常检测是识别先进机械加工和精密制造缺陷的黄金标准。尽管该领域在方法上取得了一些进展，但数据集的稀缺以及缺乏系统的基准阻碍了其发展。我们引入Real3D - AD，这是一个具有挑战性的高精度点云异常检测数据集，旨在解决该领域的局限性。Real3D - AD包含1254个高分辨率三维对象（每个对象包含4万到数百万个点），是目前最大的高精度三维工业异常检测数据集。全视角点云

2025-05-18 00:45:23 1249

原创 The Eyecandies Dataset for Unsupervised Multimodal Anomaly Detection and Localization 论文精读

Eyecandies 是一个用于无监督多模态异常检测与定位的新型合成数据集，旨在模拟工业视觉检测场景。该数据集包含在多种光照条件下渲染的程序生成糖果的逼真图像，同时提供深度图和法向图。数据集包含十种糖果，呈现出复杂纹理、自遮挡和高光等挑战，并通过随机绘制程序渲染流水线的关键参数实现大量类内变化。异常样本通过自动生成像素级标注，克服了人为偏差和不一致性。Eyecandies 数据集鼓励探索结合颜色、深度和法向图的异常检测方法，并展示了利用额外信息可以提高检测性能。该数据集为无监督异常检测提供了一个新的、具有挑

2025-05-15 21:56:54 826

原创 The MVTec 3D-AD Dataset for Unsupervised 3D Anomaly Detection and Localization 论文精读

MVTec 3D-AD数据集是首个专为无监督三维异常检测与定位任务设计的综合性数据集，旨在模拟现实工业检测场景。该数据集包含10种不同物体类别的高分辨率三维扫描数据，训练集和验证集仅包含无异常样本，而测试集则包含各种类型的缺陷样本，如划痕、凹痕、孔洞等，并为每个异常提供了精确的真实标注。数据集的引入填补了三维异常检测领域的数据空白，初步基准测试显示现有方法在该数据集上表现不佳，表明未来仍有较大改进空间。该数据集有望推动三维计算机视觉领域的新方法开发，特别是在工业检测等实际应用中。

2025-05-14 15:29:42 757

原创 Revisiting Multimodal Fusion for 3D Anomaly Detection from an Architectural Perspective 论文精读

项工作考虑了模块内融合层面的多模态融合架构设计，即==独立的模态特定模块==（涉及早期、中期或晚期多模态特征与特定融合操作），以及==模块间融合层面==（即融合这些模块的策略）。在这两种情况下，我们首先通过理论和实验探索架构设计的影响。然后，我们扩展了当前最优的神经架构搜索（NAS）范式，提出3D - ADNAS，以==同时搜索多模态融合策略和模态特定模块==。

2025-05-11 15:19:05 731

原创 Multimodal Industrial Anomaly Detection via Hybrid Fusion 论文精读

基于二维的工业异常检测已被广泛探讨，然而，基于三维点云和RGB图像的多模态工业异常检测仍存在诸多尚未涉足的领域。现有的多模态工业异常检测方法直接连接多模态特征，这会导致特征间产生强烈干扰，损害检测性能。首先，我们设计了一种基于逐块对比学习的无监督特征融合方法，以促进不同模态特征间的交互；其次，我们使用带有多个记忆库的决策层融合，避免信息损失，并利用额外的新颖分类器做出最终决策；此外，我们还提出了点特征对齐操作，以便更好地对齐点云和RGB特征。

2025-05-06 22:18:53 833

原创代码随想录算法训练营第三十四天|代码随想录 96.不同的二叉搜索树

F[i] = F[i] + F[j] * F[i - j - 1];：根据二叉搜索树的性质，不同结构的二叉搜索树的数量等于左子树的不同结构数量乘以右子树的不同结构数量。所以将所有可能的根节点选择下的左右子树结构数量乘积累加起来，就得到了具有i 个节点时的不同二叉搜索树的数量。

2025-04-26 22:58:30 313

原创代码随想录算法训练营第三十四天|代码随想录 343. 整数拆分

F[i] = max(F[i], max(F[i - j] * j, (i - j) * j));：对于每一种拆分方式，计算两种可能的乘积：F[i - j] * j：表示将i - j进一步拆分后得到的最大乘积再乘以j。(i - j) * j：表示不将i - j 进一步拆分，直接用 i - j 和j 相乘。取这两种乘积中的较大值，再与当前 F[i] 中的值比较，将较大值更新到 `F[i]` 中。

2025-04-26 22:38:20 139

原创代码随想录算法训练营第三十四天|代码随想录 63. 不同路径 II

如果当前位置没有障碍物（obstacleGrid[i][j] != 1），则到达该位置的路径数量等于到达上方位置和左方位置的路径数量之和，即 F[i][j] = F[i - 1][j] + F[i][j - 1]。如果当前位置有障碍物（obstacleGrid[i][j] == 1），则无法到达该位置，将 F[i][j] 设为 0。

2025-04-26 22:04:45 296

原创代码随想录算法训练营第三十四天|代码随想录 62.不同路径

对于网格中第 `i` 行第 `j` 列的位置，到达该位置的路径数量等于到达其上方位置 `(i - 1, j)` 的路径数量加上到达其左方位置 `(i, j - 1)` 的路径数量。这是因为只能从上方或左方移动到当前位置。

2025-04-26 21:42:39 198

原创代码随想录算法训练营第三十二天|代码随想录 746. 使用最小花费爬楼梯

一是从第 i - 1 阶爬 1 阶上来，此时花费为 money[i - 1] + cost[i - 1]；二是从第 i - 2 阶爬 2 阶上来，此时花费为 money[i - 2] + cost[i - 2]。取这两种方式中的较小值作为到达第 i 阶的最小花费。

2025-04-26 21:06:42 289

原创代码随想录算法训练营第三十二天|代码随想录 70. 爬楼梯

对于第 i 阶楼梯，到达它的爬法总数等于到达第 i - 1 阶楼梯的爬法总数加上到达第 i - 2 阶楼梯的爬法总数。

2025-04-26 20:42:23 197

原创代码随想录算法训练营第三十二天|代码随想录 509. 斐波那契数

这里a代表F(n-2)，b代表F(n-1)。所以每一次循环结束，a和b都要随之改变。

2025-04-26 20:30:01 259

原创 CVPR 2023 名字里带Anomaly Detection的论文合集

CVPR 2023 异常检测合集

2025-04-21 23:03:12 1141

原创 RAG from scratch: Part 11 (Query Structuring) by LangChain

将非结构化自然语言输入，转化为遵循自定义模式的结构化查询对象，适配不同查询需求。

2025-04-17 20:57:30 662

原创 RAG from scratch: Part 10 (Routing) by LangChain

路由的本质是将经过查询翻译后的问题，根据其内容和特征，导向最合适的处理途径或数据源，以实现高效准确的信息检索和处理。

2025-04-17 18:17:11 1088

原创 RAG from scratch: Part 9 (Query Translation -- HyDE) by LangChain

以之前视频使用的notebook为例，针对已编入索引的关于代理的博客文章，定义提示“写一篇xxx来回答给定的问题”，用于生成假设文档。

2025-04-17 16:10:59 1090

原创 R3D-AD: Reconstruction via Diffusion for 3D Anomaly Detection 论文精读

Reconstruction 重建via 通过Diffusion 扩散Diffusion for 3D Anomaly Detection 基于扩散的三维异常检测三维异常检测在监测精密制造中局部固有缺陷方面起着至关重要的作用。基于嵌入和基于重建的方法是最受欢迎且成功的方法之一。然而，实际应用中存在两大挑战：其一，基于嵌入的模型因内存限制而遭受严重的计算和存储问题；其二，基于重建的模型采用移动平均误差（MAE）机制，无法检测未掩码区域中的异常。在本文中，我们提出R3D - AD，一种通过扩散模型重建

2025-04-15 22:31:44 1423

空空如也

空空如也