自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(59)
  • 问答 (1)
  • 收藏
  • 关注

原创 《智能网联汽车 自动驾驶功能场地试验方法及要求》 GB/T 41798-2022——解读

本标准通过系统化的试验方法和严苛的通过条件,为智能网联汽车的自动驾驶功能提供了安全性验证的基础框架,企业需结合自身技术特点,灵活应用并补充实际道路验证,以全面保障自动驾驶系统的可靠性。:通过可控的场地试验场景,验证自动驾驶系统对典型交通场景的应对能力,确保其安全性。测试需结合道路试验和仿真试验,形成完整的验证体系。:红灯停车精度(乘用车距离停止线≤2 m,商用≤4 m),绿灯起步时间(乘用车≤3 s,商用≤5 s)。:具备自动驾驶功能的M类(乘用车)、N类(商用车)车辆,其他类型车辆可参照执行。

2025-05-08 11:13:34 302

原创 《乘用车自动紧急制动系统(AEBS)性能要求及试验方法》(GB/T 39901—2021)——解读

采用FMEA、FTA等方法分析潜在危害,定义安全完整性等级(ASIL),并验证系统在故障状态下的反应。:以30 km/h测试,车辆不得碰撞,预警阶段速度下降≤15 km/h或30%车速(取高值)。:检测到前方车辆(静止、移动或制动目标)时,至少通过两种模式(声学、触觉、光学)预警。:车辆以30 km/h驶向静止目标,中心线偏差≤0.5 m,距离≥60 m。:车辆与目标均以50 km/h行驶,相距40 m时前车以4 m/s²减速。:车辆50 km/h,目标20 km/h,同向行驶距离≥120 m。

2025-05-08 10:35:37 488

原创 WiseAD:基于视觉-语言模型的知识增强型端到端自动驾驶——论文阅读

在这篇论文中,我们研究了基础驾驶知识的深度和广度对闭环轨迹规划的影响,并介绍了WiseAD,这是一种专为端到端自动驾驶量身定制的专用VLM,能够进行驾驶推理、动作论证、对象识别、风险分析、驾驶建议和跨不同场景的轨迹规划。大量实验表明,随着驾驶知识多样性的扩大,严重事故显著减少,在卡拉闭环评估中,驾驶分数和路线完成率分别提高了11.9%和12.4%,达到了最先进的性能。:在Carla闭环评估中,驾驶分数(DS)提升11.9%,路线完成率(RC)提升12.4%,关键事故(碰撞、闯红灯)显著减少。

2025-05-08 09:53:46 320 1

原创 Pytorch的简单介绍(起源、历史、优缺点、应用领域等等)

PyTorch 凭借其灵活性、易用性和强大的社区支持,已成为深度学习领域的“科研标准”,并逐步渗透到工业场景。其发展史反映了从研究到生产的平衡艺术,未来将继续推动 AI 技术的边界。Torch 以其灵活的神经网络设计和高效的 GPU 加速闻名,但受限于 Lua 的小众性和陡峭的学习曲线,始终未成为主流。官方库覆盖 CV(TorchVision)、NLP(TorchText)、音频(TorchAudio)等领域。从芯片级(支持更多 NPU/TPU)到应用层(简化端到端部署),构建更完整的 AI 基础设施。

2025-05-08 09:38:39 310

原创 PyTorch常用命令(可快速上手PyTorch的核心功能,涵盖从数据预处理到模型训练的全流程)

【代码】PyTorch常用命令(可快速上手PyTorch的核心功能,涵盖从数据预处理到模型训练的全流程)

2025-05-07 14:20:29 600

原创 使用DeepSeek编写开发代码

(2)对于要编写比较复杂的代码,输出代码可能不能直接使用,需要进行修改,但代码逻辑是根据输入的提示词来编写的,所以只要逻辑正确,在输出结果基础上修改总比从头自己实现来的方便的多,并且可以为你提供思路。给定一个整数数组 nums 和一个整数目标值 target,请你在该数组中找出 和为目标值 target 的那 两个 整数,并返回它们的数组下标。解释:因为 nums[0] + nums[1] == 9 ,返回 [0, 1]。输入:nums = [2,7,11,15], target = 9。

2025-05-07 10:41:37 611

原创 SafeDrive:大语言模型实现自动驾驶汽车知识驱动和数据驱动的风险-敏感决策——论文阅读

为了解决这些问题,我们提出了SafeDrive,这是一个知识和数据驱动的风险敏感决策框架,以提高自动驾驶汽车的安全性和适应性。拟议框架引入了一个模块化系统,包括:(1)风险模块,用于全面量化涉及驾驶员、车辆和道路相互作用的多因素耦合风险;对以动态和高风险场景为特征的现实世界交通数据集进行广泛评估,包括高速公路(HighD)、十字路口(InD)和环形交叉口(RounD),验证了该框架提高决策安全性(实现100%的安全率)、复制类人驾驶行为(决策一致性超过85%)以及有效适应不可预测场景的能力。

2025-05-07 09:54:54 538 1

原创 VLM-AD:通过视觉语言模型监督实现端到端自动驾驶

现有的端到端(E2E)自动驾驶(AD)模型通常经过优化,以模拟数据中观察到的驾驶模式,而不捕获底层推理过程。为了缩小这一差距,我们提出了VLM-AD,这是一种利用视觉语言模型(VLM)作为教师的方法,通过提供包含非结构化推理信息和结构化动作标签的额外监督来加强培训。而直接集成大语言模型(LLM)或视觉语言模型(VLM)的方法则需要大量微调,且推理时依赖大模型,计算开销大。现有的端到端(E2E)自动驾驶模型通过模仿数据中的驾驶模式进行优化,但缺乏人类驾驶员在复杂场景中的。”)生成非结构化文本。

2025-05-07 09:17:59 600

原创 LeapVAD:通过认知感知和 Dual-Process 思维实现自动驾驶飞跃——论文阅读

现有自动驾驶技术中,数据驱动方法依赖大量标注数据且缺乏复杂场景下的推理能力,而知识驱动方法(如基于视觉语言模型VLM)虽具备一定推理能力,但评估方法多为开环测试,无法反映动态交互环境。框架,融合认知感知(人类注意力机制)与双过程思维(分析过程System-II + 启发式过程System-I),结合记忆库和反射机制,实现闭环环境下的持续优化。记忆库(CARLA训练)跨域迁移有效,ADS(驾驶分数)达45.52%,优于端到端方法(如VAD、UniAD)。

2025-05-07 09:06:31 702 1

原创 李沐动手深度学习(pycharm中运行笔记)——09.softmax回归+图像分类数据集+从零实现+简洁实现

Softmax回归是一个多类分类模型使用Softmax操作子得到每个类的预测置信度使用交叉熵来衡量预测和标号的区别。

2025-05-07 07:39:10 1133

原创 对windows的简单介绍

主要服务于个人用户(Windows 10/11)、企业用户(Windows Server)、嵌入式设备(Windows IoT)及混合现实(Windows Mixed Reality)。:Windows 是由微软(Microsoft)开发的一系列图形化操作系统(GUI-based OS),最初发布于1985年,是全球使用最广泛的个人计算机操作系统。(2021):全新UI设计(Fluent Design),支持Android应用、DirectStorage等技术。

2025-05-06 17:30:39 753

原创 李沐动手深度学习(pycharm中运行笔记)——08.线性回归+从零实现+简洁实现

线性回归的从零实现(不使用任何的深度学习框架提供的计算,只使用最简单的在tensor上的计算):我们将从零开始实现整个方法,包括数据流水线、模型、损失函数和小批量随机梯度下降优化器。2、根据带有噪声的线性模型构造一个 人造数据集,我们使用线性模型参数 w = [2, -3.4]T、b = 4.2 和噪声项 ϵ,生成数据集及标签 y = Xw + b + ϵ。2、人造数据集,使用线性模型参数 w = [2, -3.4]T、b = 4.2;9、 因为本次用的时人工数据集,可以看到真实的w、b;

2025-05-06 10:15:15 677

原创 目标检测(Object Detection)研究方向常用数据集简单介绍

目标检测是计算机视觉的核心任务之一,旨在从图像或视频中定位并识别出所有感兴趣的物体,输出其类别和位置(通常以边界框表示)。其研究主要围绕精度与速度的平衡展开,并逐步向多模态、轻量化、开放集等方向扩展。Two-Stage检测算法(如R-CNN系列):首先生成候选区域(Region Proposal),再对候选区域分类和位置修正。这类算法精度高但速度较慢,典型代表包括Fast R-CNN、Faster R-CNN和Mask R-CNN159。One-Stage检测算法。

2025-05-06 09:35:46 712

原创 对“智能驾驶”改为“辅助驾驶”的简单介绍分析总结(2025)

此次政策调整标志着智能驾驶行业从“野蛮生长”转向“安全优先”。车企需在技术创新与合规宣传间平衡,消费者则需明确自身始终是安全责任主体。未来,随着法规完善和技术成熟,人车协同的出行模式将逐步落地。如有错误及不足之处,还请讨论批评指正。

2025-05-06 09:06:40 365

原创 虚拟机(Virtual Machine, VM)的简单介绍

未来,随着硬件虚拟化技术的演进和云原生生态的融合,虚拟机将继续向高性能、轻量化、安全化的方向发展,与容器技术形成互补,共同推动计算资源的灵活性与效率。虚拟机(VM)是一种通过软件模拟的完整计算机系统,能够在物理硬件上运行多个独立的操作系统(OS)和应用环境。模拟完整的硬件环境,支持运行独立操作系统(如VMware Workstation、Hyper-V)。,即通过抽象层将物理资源(CPU、内存、存储、网络等)划分为多个逻辑单元,供不同虚拟机使用。:多个虚拟机可能争夺物理资源(如CPU、I/O)。

2025-05-05 09:15:59 607

原创 linux嵌入式的简单介绍

Linux嵌入式系统是将Linux操作系统移植到专用硬件设备中,通过定制化实现特定功能的计算平台。其核心优势在于开源、可裁剪、丰富的生态支持,广泛应用于智能家居、工业控制、医疗设备、车载系统等领域。Linux嵌入式系统凭借其灵活性、强大的网络能力和开源生态,成为复杂嵌入式设备的首选平台。然而,在实时性、资源占用等方面的局限性使其需与RTOS互补(如工业控制中Linux处理上层逻辑,RTOS管理实时任务)。

2025-05-05 08:49:57 549

原创 DeepSeek提示词的技巧

初期可使用"角色扮演+分步思考+示例输出"组合拳,后续根据具体场景微调参数。"用《人类简史》的叙事风格,创作一个关于AI伦理的寓言故事,突出技术双刃剑效应"假设你是提示词优化专家,请分析我刚才的查询存在哪些不足,并提出3个改进建议。✅ "用通俗语言总结气候变化对农业的三大影响,每点不超过20字"在提示词首句明确任务类型(如:生成/分析/翻译/总结/推理)要求:对比去年同期数据,用表格呈现关键指标,最后附50字结论。警惕时间悖论:"预测2030年后的具体技术参数"避免绝对化表述:"所有""绝对""100%"

2025-05-05 08:10:12 1417

原创 对ubuntu的简单介绍

尽管存在软件生态和硬件兼容性挑战,但凭借强大的社区和企业支持,Ubuntu 仍是开源世界的标杆之一。自 2004 年首个版本发布以来,Ubuntu 凭借其易用性、稳定性和免费特性,成为最受欢迎的 Linux 发行版之一,尤其适合新手和开发者。支持 x86、ARM 架构,预装主流硬件驱动(NVIDIA/AMD 显卡、Wi-Fi 芯片等)。:替代 Windows/macOS,适合办公(LibreOffice)、网页浏览、编程。:跨发行版容器化格式,支持自动更新(如 Firefox、VSCode)。

2025-05-05 07:23:12 692

原创 对linux的简单介绍

Linux以其开源基因和技术灵活性,成为现代数字基础设施的核心。从服务器到智能手机,从科研到消费电子,Linux持续推动技术创新。尽管面临桌面生态的挑战,其在云计算、AI和物联网领域的领导地位无可替代,未来仍将是开源革命的中坚力量。!!

2025-05-05 07:22:55 945

原创 深度学习的简单介绍

定义深度学习是机器学习的一个子领域,通过构建深层神经网络(DNN)实现对数据的多层次抽象和表征学习。其核心在于通过非线性变换逐层提取数据的高阶特征,最终完成分类、回归或生成任务19。发展历程1950-1980年代:以感知机和反向传播算法为雏形,受限于计算能力和数据规模,发展缓慢。1990-2000年代:支持向量机(SVM)和浅层网络主导,但未能突破复杂任务瓶颈。2012年:AlexNet在ImageNet竞赛中夺冠,深度学习正式进入爆发期,卷积神经网络(CNN)和Transformer架构成为主流。

2025-05-04 20:49:37 733

原创 机器学习的简单介绍

机器学习正从“单一任务优化”向“通用智能构建”演进,其核心驱动力在于算法创新(如对偶学习5)、跨学科融合与伦理治理的平衡。理论突破:建立统一的学习框架(如感知与认知的语义空间投射3)。技术普惠:轻量级算法降低计算门槛,推动边缘设备智能化。伦理规范:解决数据偏见与模型透明性问题,构建可信AI系统。机器学习的终极目标不仅是模拟人类智能,更是拓展人类认知边界,成为解决全球性挑战(如气候变化、疾病预测)的核心工具。其发展将深刻重塑科学研究范式与产业生态,开启“人机协同”的新纪元。!!

2025-05-04 20:44:39 765

原创 LearningFlow:大语言模型城市驾驶的自动化策略学习工作流程

LearningFlow包括课程序列生成过程和奖励生成过程,它们协同工作,通过生成量身定制的培训课程和奖励函数来指导强化学习政策。通过这些LLM代理的协作努力,LearningFlow自动化了一系列复杂驾驶任务中的策略学习,大大减少了对手动奖励功能设计的依赖,同时提高了样本效率。在高保真CARLA模拟器中进行了全面的实验,并与其他现有方法进行了比较,以证明我们提出的方法的有效性。它还实现了卓越的性能和跨各种驾驶任务的鲁棒泛化,以及对不同RL算法的值得称赞的适应性。

2025-05-02 10:45:16 1140

原创 大模型简单介绍

大模型(Large Language Models, LLMs)是基于深度学习技术构建的超大规模人工智能模型,参数量级通常达数十亿至万亿级别,通过海量数据预训练学习复杂模式,具备强大的泛化能力和多任务处理能力159。参数量级庞大:例如GPT-3拥有1750亿参数,GPT-4参数量达约1.8万亿13。预训练+微调范式:先在通用数据(如互联网文本)上预训练,再针对特定任务微调,实现灵活迁移学习15。涌现能力:参数规模超过临界值(约百亿级)后,模型展现出未显式训练的复杂能力,如逻辑推理、跨语言迁移等19。

2025-05-02 06:27:48 929

原创 使用 DeepSeek+XMIND 制作思维导图

(1)点击左上侧三个点->文件->导入->Markdown->然后会跳转到文件目录(选择之前保存的 .md文件),然后等待自动生成思维导图。需求:请将以上文档中的内容,生成思维导图,并且以markdown的格式输出;(3) 将复制的内容粘贴到 新建的文本文档 .txt 文件中,然后保存。为避免与之前不同对话之间相互影响,请开启一个新对话。(4)将文本文档重命名,后缀改为 .md。(1)复制DeepSeek输出的内容。(2)新建文本文档 .txt 文件。1、在对话框输入需求。(2) 思维导图生成。

2025-05-02 06:26:49 361

原创 世界模型的简单介绍

未来的突破需依赖跨学科协作(如认知科学与AI的交叉),并解决可解释性、伦理等关键问题。它是智能体(人类、AI系统等)理解、预测和干预外部世界的认知框架。结合神经网络(感知)与符号逻辑(推理),例如DeepMind的“可微分逻辑层”。:结合蒙特卡洛树搜索(动态模拟)与深度神经网络(棋局评估),构建围棋世界模型。人类反馈强化学习(RLHF)优化模型(如ChatGPT的价值观对齐)。构建跨任务、跨领域的统一模型(如Meta的“世界模型即服务”愿景)。:统一视觉、语言、触觉等多源信息(如机器人多传感器融合)。

2025-05-01 07:12:12 667

原创 AutoDL算力云使用流程(保姆级教程)

(2)需要自己配置环境:选择Miniconda,然后选择自己需要的conda版本、cuda版本、python版本,之后再进行pytorch的安装以及环境配置(需要自己配置环境)。选择「无卡模式启动」可暂停实例节省费用(关机后仅存储计费),在上传数据,上传代码,修改代码等等不需要使用GPU时,记得使用无卡模式启动,免得浪费租用GPU的钱。我的镜像:会显示你之前创建过的镜像,如果需要的跟你之前项目相同的等环境,则不需要重新配置,直接就可以再次创建,这里有我之前的镜像FeatDepth1。

2025-05-01 07:09:47 1460

原创 使用DeepSeek高效写文档(DeepSeek嵌入world中)

Office AI 插件会自动集成在world里面;进入配置页面之后:点击ApiKey->选择模型平台->选择模型名->将复制的API密钥粘贴->保存,配置完成。点击API密钥->点击新建API密钥,如下图。点击编辑按钮,进入到配置页面,如下图。2、 配置 Office AI。1、进入 硅基流动 官网。

2025-04-30 08:38:18 463

原创 深度估计研究方向常用数据集介绍

深度估计(Depth Estimation)是计算机视觉中的核心任务之一,旨在从单目、双目或多视角图像中恢复场景的三维几何信息。单目深度估计:仅用单张图像预测深度(无需多视角或传感器)。立体匹配(双目深度估计):利用双目图像视差恢复深度。多视角深度估计:基于多个视角的图像或视频序列(如SLAM、MVS)。传感器融合:结合RGB图像与激光雷达(LiDAR)、ToF相机等传感器数据。应用场景:自动驾驶、机器人导航、增强现实(AR/VR)、3D重建等。

2025-04-30 08:37:19 556

原创 Sce2DriveX: 用于场景-到-驾驶学习的通用 MLLM 框架——论文阅读

Sce2DriveX利用来自局部场景视频和全局BEV地图的多模态联合学习,深入了解长距离时空关系和道路拓扑,增强其在3D动态/静态场景中的综合感知和推理能力,实现跨场景的驾驶泛化。在此基础上,它重建了人类驾驶固有的内隐认知链,涵盖场景理解、元动作推理、行为解释分析、运动规划和控制,从而进一步弥合了自动驾驶与人类思维过程之间的差距。:传统方法依赖刚性规则或小型模型,缺乏对驾驶过程的渐进式推理(Chain-of-Thought, CoT),导致决策逻辑不透明,难以与人类驾驶思维对齐。

2025-04-29 17:18:09 796 1

原创 人体姿态估计常用数据集介绍

人体姿态估计(Human Pose Estimation)是计算机视觉领域的核心任务之一,旨在从图像或视频中检测并定位人体的关键解剖部位(如关节、头部、四肢等),构建人体骨架模型。2D姿态估计:在图像平面上预测人体关键点的二维坐标。3D姿态估计:进一步恢复关键点的三维空间位置,或估计关节角度。多人姿态估计:在复杂场景中同时检测多人的姿态,解决遮挡、密集人群等问题。应用场景广泛,包括动作识别、人机交互、运动分析、虚拟现实、医疗康复等。近年来,随着深度学习技术的进步,姿态估计在精度和实时性上均取得显著突破。

2025-04-29 15:07:26 734

原创 云算力平台简单介绍,具体有哪些?

本文章对目前主流的一些进行了介绍,并最后进行简单的对比分析,方便需要算力的小伙伴有个初步的了解判断。

2025-04-29 12:05:40 742

原创 DeepSeek的应用方向,在日常办公中的应用等

DeepSeek凭借其低成本、高适配性及多模态能力,已在政务、医疗、金融等领域实现规模化应用,并在日常办公中显著提升效率。未来,通过多模态融合、垂直领域深化及边缘计算部署,其应用场景将进一步扩展至智能制造、个性化健康管理等方向,推动社会智能化转型。需注意的是,数据安全与伦理合规仍是关键挑战。!!

2025-04-29 09:11:20 777

原创 VLM-E2E:通过多模态驾驶员注意融合增强端到端自动驾驶——论文阅读

VLM-E2E通过。

2025-04-28 15:09:45 944 1

原创 简单分析自动驾驶发展现状与挑战

自动驾驶技术正通过政策试点、硬件迭代与数据驱动快速演进,但全面取代人工驾驶仍需克服技术可靠性、法律框架及公众信任等多重挑战。短期内,L3级技术将重塑高端出行体验,而无人化物流与封闭场景应用或成为下一阶段增长点。

2025-04-28 14:13:04 695

原创 自动驾驶领域专业词汇(专业术语)整理

以下是分类整理的自动驾驶领域专业词汇表

2025-04-28 13:45:32 1376

原创 使用 AI 自动生成会议记录并整理(使用 豆包 进行会议记录)

会议记录并整理流程

2025-04-28 10:08:37 348

原创 如何让自己的博客可以在百度、谷歌、360上搜索到(让自己写的CSDN博客可以有更多的人看到)

发现自己写的博客文章名复制,然后粘贴到百度进行搜索,发现搜索不到自己的,但是会显示其他人的CSDN博客。于是查找相关资料,整理出以下搜索引擎资源收录入口,把自己的文章链接输入进去,然后经过审核通过后,便可以在相应的搜索引擎上搜索到自己的CSDN博客了。链接提交_加快网站内容抓取,快速提交数据工具_站长工具_网站支持_百度搜索资源平台。如下图所示,将CSDN博客链接输入,并提交,然后完成。提交后,审核通过,博客就可以被更多人搜索到啦。搜狗资源平台_公平开放的交流平台。谷歌搜索引擎提交入口。

2025-04-27 17:02:28 1315

原创 LLM应用于自动驾驶方向相关论文整理(大模型在自动驾驶方向的相关研究)

1、《HILM-D: Towards High-Resolution Understanding in Multimodal Large Language Models for Autonomous Driving》2023年9月发表的大模型做自动驾驶的论文,来自香港科技大学和人华为诺亚实验室(代码开源)。论文简介:本文提出HiLM-D方法,通过整合低分辨率推理分支(LR-RB)和高分辨率感知分支(HR-PB),解决多模态大语言模型(MLLMs)在自动驾驶任务中因低分辨率输入导致的小物体漏检和显著物体过于关

2025-04-27 14:43:10 781

原创 自动驾驶(ADAS)领域常用数据集介绍

由德国卡尔斯鲁厄理工学院与丰田研究院联合创建,是自动驾驶领域最经典的评测基准,涵盖立体视觉、光流、3D检测等任务。包含市区、乡村和高速公路场景的真实数据,标注对象包括车辆、行人等,支持多传感器数据(摄像头、激光雷达、GPS等)。

2025-04-27 14:26:09 1209

原创 李沐动手深度学习(pycharm中运行笔记)——07.自动求导

6、即使构建函数的计算图需要通过python控制流(例如,条件、循环或任意函数调用),我们仍然可以计算得到的变量的梯度。4、对非标量调用 backward 需要传入一个 gradient 参数,该参数指定微分函数。2、假设我们想对函数 y = 2x.Tx,就是 2乘x的内积,关于列向量x求导,也就是4x。3、现在让我们计算 x 的另一个函数,续上边。5、将某些计算移动到记录的计算图之外。

2025-04-27 13:16:32 331

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除