
论文
文章平均质量分 88
人工智能-研究所
SCI/论文带读/本硕博毕业论文/中文核心期刊/EI会议/期刊/顶会发刊论文指导
文章相关资源可关注V.X【服务号】:AI技术星球 发送:211C 自取
展开
-
当Transformer遇到调优困境:工程师必备的模型性能提升路线图
本文探讨了机器学习项目中模型性能调优的系统方法论,强调了在超参数优化过程中探索与利用的平衡,以及参数间的关联性。文章提出了科学调优的四个关键步骤:目标定义、实验设计、结果分析和决策上线,并介绍了增量式演进策略和空间搜索的三维平衡方法。此外,文章还提供了训练曲线诊断法、方差分解模型和隔离图技术等结果验证工具,以及终局优化策略,包括验证集折叠技术、集成搜索策略和硬件感知优化。最后,文章提醒读者在调优前应确保数据清洗和模型框架选择等前期工作已完成,并提供了丰富的AI学习资源和论文指导服务。原创 2025-05-12 20:48:25 · 571 阅读 · 0 评论 -
研究生必看:学术入门,少走三年弯路,加快论文进度
温馨提示:本文适合研0的同学快速入门一篇论文,想冲顶刊的学霸可以期待我们后续的文章哦~在正文开始之前,我们为大家整理了【】,主要包括了:1、SCI论文写作、投稿、修改助手、插图规范2、SCI管理软件、英语写作辅助和润色、写作与画图必备神器3、SCI 写作套路化模板(高级句型)4、上千份八大主流神经网络及变体、大模型、AIGC等AI各方向论文及代码5、写论文必备书籍6、历年及最新优秀顶刊论文合集。原创 2025-05-12 20:35:13 · 570 阅读 · 0 评论 -
LoRI比Lora精简95%参数的同时,实现更强性能,Lora到底有多少参数是冗余的?
马里兰大学和清华大学的研究团队提出的LoRI技术,犹如一把精巧的瑞士军刀,以惊人的95%参数削减,不仅解决了资源消耗问题,更在多任务协同和持续学习方面展现出非凡潜力。以 Llama-3-8B 和 Mistral-7B 作为基础模型,他们的结果表明,LoRI 达到或超过了全量微调(FFT)、LoRA 和其他 PEFT 方法的性能,同时使用的可训练参数比 LoRA 少 95%。通过使用固定的、随机初始化的投影 A,LoRI 将任务特定的适配器映射到近似正交的子空间,从而减少合并多个 LoRI 时的干扰。原创 2025-05-09 16:10:56 · 562 阅读 · 0 评论 -
ICML 2025 | 清华、上海AI Lab等提出傅里叶位置编码,多项任务远超RoPE
|机器之心长文本能力对语言模型(LM,Language Model)尤为重要,试想,如果 LM 可以处理无限长度的输入文本,我们可以预先把所有参考资料都喂给 LM,或许 LM 在应对人类的提问时就会变得无所不能。但是,LM 通常只在较短窗长下进行训练,可能产生过拟合,只学习到指定范围内的位置关系,但是无法理解没学习过的位置关系。为了缓解这个问题,当下最流行的便是引入具有周期性的旋转位置编码(Rotary Position Embedding,RoPE)。由于周期性编码每间隔一定距离就会出现数值重复,所以 L原创 2025-05-08 15:10:34 · 611 阅读 · 0 评论 -
频上Nature中科院一区!?多尺度注意力,显著涨点效果与强大的启发性
今天要给大家分享一个极具潜力的创新点 ——多尺度注意力,凭借其显著的涨点效果与强大的启发性,近来在学术界热度持续飙升。在目标检测领域,多尺度特征融合技术发挥着关键作用。将浅层网络细腻的细节特征,与深层网络富含语义的特征相结合,让小目标和遮挡目标无所遁形,显著提升检测性能。医学影像分割领域亦是如此,借助多尺度特征融合,能够精准捕捉病灶区域形态的多样性以及边界的模糊性,极大提高分割精度,为医疗诊断提供有力支持。不过,当下这一领域仍存在诸多挑战。原创 2025-04-28 15:30:26 · 644 阅读 · 0 评论 -
TTS和TTT已过时?TTRL横空出世,推理模型摆脱「标注数据」依赖,性能暴涨
另一个值得注意的现象是,随着模型大小的增加(从 1.5B 到 7B),其在 AIME 2024 和 AMC 上的性能提升也在增加,这凸显了 TTRL 的自然扩展行为:更大的模型可以在自我改进过程中产生更准确的多数投票奖励,从而更有效地学习新数据。值得注意的是,虽然 TTRL 仅依靠 Maj@N 指标进行监督,但其表现不仅能持续超越初始模型的性能上限,更能接近于那些直接在有标注测试数据上进行监督训练的模型性能。在 RL 中,奖励通常是模糊的,主要是作为探索的方向信号,这导致了 RL 对奖励噪声的鲁棒性。原创 2025-04-25 19:39:17 · 873 阅读 · 0 评论 -
毕设项目|基于OpenCV的疲劳检测
基于眼睛6个关键点的垂直和水平距离计算眼睛纵横比(Eye Aspect Ratio, EAR),公式为: EAR = \frac{||P2-P6|| ||P3-P5||}{2 \times ||P1-P4||}:利用OpenCV的solvePnP函数将3D人脸模型(预设的头部三维坐标)与检测到的2D关键点匹配,计算俯仰角(Pitch)、偏航角(Yaw)和滚转角(Roll):在标准测试集(如YawDD)中,EAR算法对闭眼检测准确率可达97.5%,结合头部姿态后综合准确率提升至98.3%原创 2025-04-24 14:11:25 · 583 阅读 · 0 评论 -
写论文为啥喜欢将YOLO作为第一学习目标
在学术论文中,YOLO(You Only Look Once)算法常被作为目标检测领域的“第一学习目标”,这一现象与其独特的设计理念、广泛的适用性以及学术界与工业界的双重认可密切相关。原创 2025-04-22 20:22:47 · 719 阅读 · 0 评论 -
微软TimeDP:创新时间序列生成模型,突破跨领域应用局限性
编者按:随着人工智能技术的飞速发展,时间序列数据的应用价值在众多领域崭露头角。然而,现有方法往往难以有效应对不同领域之间的差异性,这在很大程度上限制了其广泛应用。在此背景下,微软亚洲研究院提出了一种创新的时间序列扩散生成模型 TimeDP。该模型通过引入时间序列原型和领域提示,突破了传统方法的局限,实现了高效的跨领域时间序列生成,显著提升了模型的泛化能力和灵活性。人工智能技术的持续演进,让时间序列数据在众多领域中的应用价值愈发凸显,尤其是在医疗健康、金融市场、气象预测和交通管理等行业。原创 2025-04-19 11:01:04 · 578 阅读 · 0 评论 -
频域+PINN新风向!好发不卷!上Nature!发高分SCI易如反掌!
PINN一直是火爆且好发论文的方向,目前已有多篇成果登上Nature及Science正刊。今天再给大家介绍一个好发又不卷的新风向——PINN+频域!:这是一种新的PINN变体,它通过将偏微分方程在周期性空间维度上进行离散傅里叶变换,将原始的偏微分方程转化为频域中的低维微分方程组。这种方法不仅减少了自变量的数量,而且降低了求解难度。与经典的PINN相比,FD-PINN能够减少输入样本的数量和优化难度,从而在降低训练成本的同时提高求解精度。原创 2025-04-19 10:49:18 · 735 阅读 · 0 评论 -
CVPR 2025即插即用|超越可变形卷积! 更强劲的自适应矩形卷积!
基于自适应矩形卷积的遥感全色锐化电子科技大学本文提出了一种名为Adaptive Rectangular Convolution (ARConv)的创新卷积模块,用于改进遥感图像的Pansharpening技术。ARConv能够自适应地调整卷积核的高度和宽度,并动态改变采样点的数量,从而有效捕捉图像中不同大小物体的特定尺度特征,优化核尺寸和采样位置。结合ARConv模块,作者还提出了ARNet网络架构,并通过多个数据集的广泛评估,证明了该方法在提升Pansharpening性能方面优于先前的技术。原创 2025-04-18 14:41:25 · 649 阅读 · 0 评论 -
什么样的偏好,才叫好的偏好?——揭秘偏好对齐数据的「三驾马车」大模型LLM
这可能表明,在追求复杂标注流程时,过多的人类要求引入了噪音,而使用简约的标注 Prompt 并利用标注模型的固有判断力,比使用复杂的标注 Prompt 更契合真实世界的偏好信号,这和 DeepSeek-R1-Zero 在 Zero-RL 过程中使用的简约 prompt 有着异曲同工之妙。因此我们研究了不同混合策略的影响。:如图 4(中)所示,在控制各组分数差距的分布一致的前提下,高分回复对(正样本分数≥8)在所有基准测试中都取得了最显著的性能,总体上比低分回复对(正样本分数<7)高出 +9.35。原创 2025-04-17 14:34:04 · 1100 阅读 · 0 评论 -
ICLR 2025 | 一行代码!FreDF频域损失稳定提升时间序列预测精度
时间序列中的自相关性指的是「序列在不同时间步之间的相关性」,在时间序列预测中,这种自相关性既存在于模型的输入序列(历史观测值之间的相关性),也存在于标签序列(不同步标签之间的相关性)。通过可视化预测序列发现,FreDF 生成的预测序列与真实标签序列之间的拟合度更高,能够更准确地捕捉到标签序列中的高频成分,同时抑制明显的噪声和异常波动。进一步,提出一种基于频域标签训练的新范式——FreDF,只需加入一行代码,即可在主流模型上实现预测精度的稳定提升。:第 t 时刻的标签不仅和输入有关,也和上一时刻的状态有关。原创 2025-04-17 14:26:17 · 688 阅读 · 0 评论 -
【附代码】登顶Nature,准备起飞!KAN-UNet又杀疯了
Nature大子刊Nature reviews electrical engineering发布了综述,深度学习在遥感树木监测的应用:用于树木资源监测的高分辨率传感器和深度学习模型论文已打包好 还有一份研究生及SCI论文攻略包本文总结了高分辨率卫星和传感器技术的发展,结合人工智能技术(CNN/ViT/UNet)的应用,推动了树木三维结构(如树冠高度和木材体积)的精准监测。模型其实也不复杂,是基于UNet的,如图所示。原创 2025-04-16 15:06:35 · 614 阅读 · 0 评论 -
可解释AI,在Transformer中可视化注意力(附代码)
Transformer 是 NLP 最重要的技术发展,也是最近DeepSeek等大模型的基础,然而它们的过程仍然不透明,缺乏可解释性。这是一个一直存在的问题,因为随着机器学习的重大进步,我们并不总是能够解释黑箱模型的内部。(需要Transformer学习资源的可关助工重号:AI技术星球 发送暗号:211C 获取)原创 2025-04-15 20:50:26 · 568 阅读 · 0 评论 -
Science子刊 | 基于公平贝叶斯扰动,首个面向医学图像生成公平性的方法FairDiffusion来了
通过公平 AUC(ES-AUC)指标(图 7),可以观察到 FairDiffusion 生成的图像与临床特征描述具有更高的一致性,特别是在青光眼和杯盘比的分类任务中,弱势群体的 AUC 值均有明显提升。FairGenMed 不仅为生成模型提供了充足且多样化的训练样本,同时也为公平性指标(如 ES-FID、ES-IS、ES-AUC)的设计提供了坚实的数据基础,有助于推动医学生成模型在公平性与实用性上的双重提升。为此,该研究引入了公平贝叶斯扰动机制,通过针对不同群体施加自适应高斯扰动,缩小群体间的误差差距。原创 2025-04-15 17:09:09 · 667 阅读 · 0 评论 -
二区水刊,全科都收,几乎不退稿的综合SCI!!
从投稿到出版平均需要约14周,涵盖自然科学的广泛领域,包括物理学、化学、天文学、地球科学、生物学、工程学、农学、医学和药学等。该刊网友反馈非常好,妥妥的潜力刊,收录包括生物医学在内的大量研究,审稿周期就1个月左右,门槛低,暂无负面评价。全科收稿,年发文量800+,安全无风险预警!该刊灌水神刊,审稿超级快,公认的好投,影响因子4+,没有强制要求想要水个毕业的老师抓紧!没时间读、不敢读、不愿读、读得少、读不懂、读不下去、读不透彻一篇完整的论文?该刊潜力无限,创刊时间短,潜力无限,现在投稿人少,竞争较小!原创 2025-04-15 14:25:35 · 395 阅读 · 0 评论