- 博客(115)
- 收藏
- 关注
原创 Attention Is All You Need 论文精读
主流的序列转导模型基于复杂的递归或卷积神经网络,包括编码器和解码器。性能最好的模型还通过注意力机制连接编码器和解码器。我们提出了一种全新且简单的网络架构——Transformer,它完全基于注意力机制,彻底摒弃了循环和卷积。在两项机器翻译任务上的实验表明,这些模型在质量上更胜一筹,同时具备出色的并行性,训练耗时也大幅减少。在WMT 2014 英德翻译任务中,我们的模型达到了28.4的BLEU值,超越了包括集成模型在内的现有最优结果,BLEU值提高了2个点。
2025-05-29 17:26:57
776
原创 Masked Autoencoders for Point Cloud Self-supervised Learning 论文精读
本文提出了一种简洁高效的点云自监督学习掩码自编码器方案Point-MAE。该方法通过将输入点云划分为不规则点块并进行高比例随机掩码,基于标准Transformer构建非对称自编码器(编码器仅处理未掩码点块,轻量级解码器重建掩码部分),有效解决了点云掩码自编码中的关键挑战:骨干网络架构统一问题、位置信息过早泄露问题以及信息密度不均匀问题。实验表明,Point-MAE在ScanObjectNN和ModelNet40上分别达到85.18%和94.04%的分类准确率,超越所有自监督学习方法,甚至优于专门设计的监督学
2025-05-27 21:56:35
1140
原创 Towards High-resolution 3D Anomaly Detection via Group-Level Feature Contrastive Learning 论文精读
本文提出了一种基于组级特征对比学习的高分辨率三维异常检测方法Group3AD。针对高分辨率点云异常检测面临的三大挑战:数据量大导致信息捕捉困难、特征表示各向异性以及异常区域比例小难以刻画,本文设计了簇间一致性网络(IUN)和簇内对齐网络(IAN)来优化特征空间分布,并提出基于几何信息的自适应组中心选择(AGCS)方法提升异常区域检测敏感性。实验表明,Group3AD在Real3D-AD数据集上对象级AUROC指标比Reg3D-AD提高5%,有效提升了高分辨率三维异常检测的性能。该方法可直接应用于各种网络架构
2025-05-26 17:11:34
857
原创 PO3AD: Predicting Point Offsets toward Better 3D Point Cloud Anomaly Detection 论文精读
本文提出了一种新颖的PO3AD框架,用于三维点云异常检测。该方法通过预测伪异常样本中的点偏移量,使模型能够专注于信息丰富的伪异常区域,从而更有效地学习正常数据表示。与现有基于重建的方法不同,PO3AD仅需估计正常点的偏移量大小,同时预测伪异常点的偏移量大小和方向,避免了对正常点和伪异常点赋予相同权重导致的问题。此外,作者设计了一种法向量引导的异常模拟方法Norm-AS,用于生成更真实的伪异常样本。在Anomaly-ShapeNet和Real3D-AD数据集上的实验表明,PO3AD显著优于现有方法,检测AUC
2025-05-25 17:19:18
587
原创 CVPR 2025 名字里带 Anomaly 的论文合集 (未发布的论文后续会更新)
CVPR 2025 名字里带 Anomaly 的论文合集 (未发布的论文后续会更新) 异常检测+二维+三维+多模态+视频+新数据集
2025-05-24 18:38:19
854
原创 Complementary Pseudo Multimodal Feature for Point Cloud Anomaly Detection 论文精读
本研究提出了一种名为互补伪多模态特征(CPMF)的方法,用于提升点云异常检测的性能。CPMF通过结合手工制作的点云描述符和预训练的二维神经网络,分别捕捉点云的局部几何信息和全局语义信息。具体而言,CPMF将原始点云投影为多视图图像,利用预训练二维神经网络提取语义特征,并将其与三维模态特征聚合,形成互补的多模态特征。实验结果表明,CPMF在MVTec3D基准测试中取得了显著的成绩,证明了其在点云异常检测中的有效性。代码已开源,供进一步研究和应用。
2025-05-21 19:13:19
1082
原创 ECCV 2024 名字里带 Anomaly 的论文合集
ECCV 2024 名字里带 Anomaly 的论文合集视频异常检测 二维异常检测 三维异常检测 多模态异常检测 异常合成 医学图像异常检测
2025-05-20 18:22:40
1318
原创 CVPR 2024 名字里带 Anomaly 的论文合集
CVPR 2024 名字里带 Anomaly 的论文合集:视频异常检测+二维+三维+多模态
2025-05-18 21:59:08
825
原创 Real3D-AD: A Dataset of Point Cloud Anomaly Detection 论文精读
高精度点云异常检测是识别先进机械加工和精密制造缺陷的黄金标准。尽管该领域在方法上取得了一些进展,但数据集的稀缺以及缺乏系统的基准阻碍了其发展。我们引入Real3D - AD,这是一个具有挑战性的高精度点云异常检测数据集,旨在解决该领域的局限性。Real3D - AD包含1254个高分辨率三维对象(每个对象包含4万到数百万个点 ),是目前最大的高精度三维工业异常检测数据集。全视角点云
2025-05-18 00:45:23
1249
原创 The Eyecandies Dataset for Unsupervised Multimodal Anomaly Detection and Localization 论文精读
Eyecandies 是一个用于无监督多模态异常检测与定位的新型合成数据集,旨在模拟工业视觉检测场景。该数据集包含在多种光照条件下渲染的程序生成糖果的逼真图像,同时提供深度图和法向图。数据集包含十种糖果,呈现出复杂纹理、自遮挡和高光等挑战,并通过随机绘制程序渲染流水线的关键参数实现大量类内变化。异常样本通过自动生成像素级标注,克服了人为偏差和不一致性。Eyecandies 数据集鼓励探索结合颜色、深度和法向图的异常检测方法,并展示了利用额外信息可以提高检测性能。该数据集为无监督异常检测提供了一个新的、具有挑
2025-05-15 21:56:54
826
原创 The MVTec 3D-AD Dataset for Unsupervised 3D Anomaly Detection and Localization 论文精读
MVTec 3D-AD数据集是首个专为无监督三维异常检测与定位任务设计的综合性数据集,旨在模拟现实工业检测场景。该数据集包含10种不同物体类别的高分辨率三维扫描数据,训练集和验证集仅包含无异常样本,而测试集则包含各种类型的缺陷样本,如划痕、凹痕、孔洞等,并为每个异常提供了精确的真实标注。数据集的引入填补了三维异常检测领域的数据空白,初步基准测试显示现有方法在该数据集上表现不佳,表明未来仍有较大改进空间。该数据集有望推动三维计算机视觉领域的新方法开发,特别是在工业检测等实际应用中。
2025-05-14 15:29:42
757
原创 Revisiting Multimodal Fusion for 3D Anomaly Detection from an Architectural Perspective 论文精读
项工作考虑了模块内融合层面的多模态融合架构设计,即==独立的模态特定模块==(涉及早期、中期或晚期多模态特征与特定融合操作),以及==模块间融合层面==(即融合这些模块的策略)。在这两种情况下,我们首先通过理论和实验探索架构设计的影响。然后,我们扩展了当前最优的神经架构搜索(NAS)范式,提出3D - ADNAS,以==同时搜索多模态融合策略和模态特定模块==。
2025-05-11 15:19:05
731
原创 Multimodal Industrial Anomaly Detection via Hybrid Fusion 论文精读
基于二维的工业异常检测已被广泛探讨,然而,基于三维点云和RGB图像的多模态工业异常检测仍存在诸多尚未涉足的领域。现有的多模态工业异常检测方法直接连接多模态特征,这会导致特征间产生强烈干扰,损害检测性能。首先,我们设计了一种基于逐块对比学习的无监督特征融合方法,以促进不同模态特征间的交互;其次,我们使用带有多个记忆库的决策层融合,避免信息损失,并利用额外的新颖分类器做出最终决策;此外,我们还提出了点特征对齐操作,以便更好地对齐点云和RGB特征。
2025-05-06 22:18:53
833
原创 代码随想录算法训练营第三十四天|代码随想录 96.不同的二叉搜索树
F[i] = F[i] + F[j] * F[i - j - 1];:根据二叉搜索树的性质,不同结构的二叉搜索树的数量等于左子树的不同结构数量乘以右子树的不同结构数量。所以将所有可能的根节点选择下的左右子树结构数量乘积累加起来,就得到了具有i 个节点时的不同二叉搜索树的数量。
2025-04-26 22:58:30
313
原创 代码随想录算法训练营第三十四天|代码随想录 343. 整数拆分
F[i] = max(F[i], max(F[i - j] * j, (i - j) * j));:对于每一种拆分方式,计算两种可能的乘积:F[i - j] * j:表示将i - j进一步拆分后得到的最大乘积再乘以j。(i - j) * j:表示不将i - j 进一步拆分,直接用 i - j 和j 相乘。取这两种乘积中的较大值,再与当前 F[i] 中的值比较,将较大值更新到 `F[i]` 中。
2025-04-26 22:38:20
139
原创 代码随想录算法训练营第三十四天|代码随想录 63. 不同路径 II
如果当前位置没有障碍物(obstacleGrid[i][j] != 1),则到达该位置的路径数量等于到达上方位置和左方位置的路径数量之和,即 F[i][j] = F[i - 1][j] + F[i][j - 1]。如果当前位置有障碍物(obstacleGrid[i][j] == 1),则无法到达该位置,将 F[i][j] 设为 0。
2025-04-26 22:04:45
296
原创 代码随想录算法训练营第三十四天|代码随想录 62.不同路径
对于网格中第 `i` 行第 `j` 列的位置,到达该位置的路径数量等于到达其上方位置 `(i - 1, j)` 的路径数量加上到达其左方位置 `(i, j - 1)` 的路径数量。这是因为只能从上方或左方移动到当前位置。
2025-04-26 21:42:39
198
原创 代码随想录算法训练营第三十二天|代码随想录 746. 使用最小花费爬楼梯
一是从第 i - 1 阶爬 1 阶上来,此时花费为 money[i - 1] + cost[i - 1];二是从第 i - 2 阶爬 2 阶上来,此时花费为 money[i - 2] + cost[i - 2]。取这两种方式中的较小值作为到达第 i 阶的最小花费。
2025-04-26 21:06:42
289
原创 代码随想录算法训练营第三十二天|代码随想录 70. 爬楼梯
对于第 i 阶楼梯,到达它的爬法总数等于到达第 i - 1 阶楼梯的爬法总数加上到达第 i - 2 阶楼梯的爬法总数。
2025-04-26 20:42:23
197
原创 代码随想录算法训练营第三十二天|代码随想录 509. 斐波那契数
这里a代表F(n-2),b代表F(n-1)。所以每一次循环结束,a和b都要随之改变。
2025-04-26 20:30:01
259
原创 RAG from scratch: Part 11 (Query Structuring) by LangChain
将非结构化自然语言输入,转化为遵循自定义模式的结构化查询对象,适配不同查询需求。
2025-04-17 20:57:30
662
原创 RAG from scratch: Part 10 (Routing) by LangChain
路由的本质是将经过查询翻译后的问题,根据其内容和特征,导向最合适的处理途径或数据源,以实现高效准确的信息检索和处理。
2025-04-17 18:17:11
1088
原创 RAG from scratch: Part 9 (Query Translation -- HyDE) by LangChain
以之前视频使用的notebook为例,针对已编入索引的关于代理的博客文章,定义提示“写一篇xxx来回答给定的问题”,用于生成假设文档。
2025-04-17 16:10:59
1090
原创 R3D-AD: Reconstruction via Diffusion for 3D Anomaly Detection 论文精读
Reconstruction 重建via 通过Diffusion 扩散Diffusion for 3D Anomaly Detection 基于扩散的三维异常检测 三维异常检测在监测精密制造中局部固有缺陷方面起着至关重要的作用。基于嵌入和基于重建的方法是最受欢迎且成功的方法之一。然而,实际应用中存在两大挑战:其一,基于嵌入的模型因内存限制而遭受严重的计算和存储问题;其二,基于重建的模型采用移动平均误差(MAE)机制,无法检测未掩码区域中的异常。在本文中,我们提出R3D - AD,一种通过扩散模型重建
2025-04-15 22:31:44
1423
原创 RAG from scratch: Part 8 (Query Translation -- Step Back) by LangChain
该内容围绕查询翻译中的“后退一步(回溯)”展开,主要介绍了其在RAG流程中的位置、解决问题的不同方法、谷歌提出的后退提示法以及具体实践操作。
2025-04-13 16:03:16
899
原创 RAG from scratch: Part 7 (Query Translation -- Decomposition) by LangChain
查询翻译处于RAG流程的前端,目标是通过修改、重写或分解用户输入的问题,以优化检索效果,提高后续回答的质量。将用户输入的问题分解为子问题是当前流行且对某些问题有用的技术。例如Google的相关工作,以“最后一个字母链接”问题为例,将“思考机器学习”这样的三个单词输入问题分解为“思考”“机器”“学习”三个子问题,按顺序分别解决子问题,利用前一个子问题的答案辅助解决下一个子问题,最终得出整体解决方案。
2025-04-12 22:09:23
747
原创 RAG from scratch: Part 6 (Query Translation -- RAG Fusion) by LangChain
本视频是“从零开始系列”中关于查询翻译的第二个视频,重点介绍了“RAG Fusion”方法,这是高级RAG流程中查询翻译阶段的一种特定重写方法。
2025-04-12 21:09:05
1231
原创 RAG from scratch: Part 5 (Query Translation -- Multi Query) by LangChain
查询翻译是高级RAG Pipeline的第一阶段,旨在接收用户输入问题,并对其进行翻译处理,以优化检索效果。助手的任务是将问题重新组织成不同子问题,将提示符传递给LLM,解析成字符串并按新行分割,得到问题列表。
2025-04-12 16:43:44
1033
原创 代码随想录算法训练营第三十一天|代码随想录 738.单调递增的数字
借助 to_string 函数把整数 N 转化为字符串 s,这样便于对数字的每一位进行操作。
2025-04-12 14:24:44
240
原创 代码随想录算法训练营第二十九天|代码随想录 406.根据身高重建队列
为什么从大到小 因为people的第二位表示前面大于等于people第一位的数量所以先处理身高大的 再处理身高小的。
2025-04-10 17:35:55
175
原创 代码随想录算法训练营第二十九天|代码随想录 860.柠檬水找零
这里优先找出10元 避免5的浪费 因为5既可以给20找零也可以给10找零。而10只能给20找零。
2025-04-10 17:07:12
132
原创 代码随想录算法训练营第二十九天|代码随想录 135. 分发糖果
如果左大于右,那么左等于max(左,右+1) 因为前面遍历改变了candy的值 可能出现 目前的左已经>右+1的情况 再赋值右+1反而会变小。从左遍历 是因为左就等于右+1 下一个时刻左又变成了 右 所以可以实现递增的累加。从右遍历 是因为左等于max(左,右+1) 下一时刻左又变成了右。如果右大于左 那么左就等于右+1;这样可以满足一次顺时针的符合。i和i-1比较实现累加 因为i-1已经被重新计算过。i和i+1比较实现累加 因为i+1已经被重新计算过。
2025-04-10 16:47:23
177
原创 代码随想录算法训练营第二十九天|代码随想录 134. 加油站
在一条环路上有 n 个加油站,其中第 i 个加油站有汽油 gas[i] 升。你有一辆油箱容量无限的的汽车,从第 i 个加油站开往第 i+1 个加油站需要消耗汽油 cost[i] 升。你从其中的一个加油站出发,开始时油箱为空。给定两个整数数组 gas 和 cost ,如果你可以按顺序绕环路行驶一周,则返回出发时加油站的编号,否则返回 -1。如果存在解,则 保证 它是 唯一 的。
2025-04-10 16:13:43
136
原创 RAG From Scratch: Part 4 (Generation) by LangChain
重点介绍RAG(检索增强生成)系统中的生成环节。
2025-04-09 22:38:04
849
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人