自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

datayx的文章

有内容有料

  • 博客(1158)
  • 资源 (23)
  • 收藏
  • 关注

转载 大模型开发实战,使用 LLaMA Factory 微调与量化模型并部署至 Ollama

它支持从预训练到指令微调、强化学习、多模态训练等全流程操作,并提供灵活的配置选项和高效的资源管理能力,适合开发者快速定制化模型以适应特定应用场景。秩越大,引入的可训练参数越多,模型对新数据的适应能力越强,但也增加了计算和内存的需求,可能导致过拟合。秩越小,引入的可训练参数较少,减少了计算和内存的需求,但可能不足以充分适应新数据,影响模型性能。Supervised Fine-Tuning:监督微调是最常见的微调方法,使用标注好的数据对预训练模型进行进一步训练,以适应特定任务(如分类、问答等)。

2025-04-23 10:48:34 73

转载 中科院2025分区表更新:科研人的避坑指南与投稿新思路

无论您是首次发文,还是希望提升科研水平,我们都将为您量身打造最适合的学习路径,助您快速掌握各类计算机sci论文以及sci论文的核心技能,轻松发表高质量SCI论文!对于指定区位的学员,不仅仅是交付初稿,被拒稿被退稿我们提供维护服务,直至中稿!除了个人科研成绩突出,更有丰富的论文辅导经验,不仅自己能写出顶会一作,更指导出多名发独立一作论文的学生,满足人工智能各个方向的辅导需求!大咖导师不仅给你带来学术上的指导,不少导师还有学术界、工业界、投资界等丰富的connection,助力你实现科研梦想。

2025-04-17 10:46:35 1270

转载 大模型高效压缩新方案!ICLR 2025最新收录!

科研为本,质量为先!这是一支实力强大的高学历导师团队,在计算机科学、机器学习、深度学习等领域,积累了丰富的科研经历,研究成果也发表在国际各大顶级会议和期刊上,在指导学员的过程中,全程秉持初心,坚持手把手个性化带教。【招收学生方向】计算机视觉,自然语言处理,高效模型压缩算法,多模态大语言模型,包括模型量化,剪枝,蒸馏,编译以及高效稀疏化训练与推理,深度学习全栈研究。多家公司担任算法研究员,并进行计算机视觉,高效模型压缩算法,多模态大语言模型的研究,包括模型量化,剪枝,蒸馏,编译以及高效稀疏化训练与推理。

2025-04-15 10:16:55 38

转载 基于大模型的 RAG 核心开发——详细介绍 DeepSeek R1 本地化部署流程

它包括了 DeepSeek R1 / DeepSeek V3 / DeepSeek Coder V2 / DeepSeek VL / DeepSeek V2 / DeepSeek Coder / DeepSeek Math / DeepSeek LLM 等多个不同的模型,以适应不同领域的应用。私人开发者可以下载 DeepSeek R1 检心框架进行调试,如果企业调用 DeepSeek 的 API 接口,也需要按 token 收费,然而费用不到 ChatGDP 的十分之一,对企业来说是相当有良心。

2025-04-11 10:18:14 48

转载 YOLOv8+ Deepsort+Pyqt5车速检测系统

其高效的检测与跟踪能力、友好的用户界面以及强大的扩展性,使其成为智慧城市建设和智能交通发展的重要工具。级联匹配:DeepSORT中的级联匹配是一种特殊的机制,它首先尝试将检测结果与高置信度的轨迹进行匹配,然后再与低置信度的轨迹进行匹配。DeepSORT算法的核心在于其对目标的外观特征和运动特征的联合使用,以及对目标匹配问题的优化处理。该算法通过融合目标检测的结果,结合匈牙利算法和卡尔曼滤波等技术,实现对多个目标的持续跟踪。轨迹管理:DeepSORT维护每个目标的轨迹,并对新检测到的目标初始化新的轨迹。

2025-04-09 10:16:59 73

转载 目标检测10年,改进YOLO还是DETR?

这是一支实力强大的高学历导师团队,在计算机科学、机器学习、深度学习等领域,积累了丰富的科研经历,研究成果也发表在国际各大顶级会议和期刊上,在指导学员的过程中,全程秉持初心,坚持手把手个性化带教。尤其是目标检测、目标跟踪、图像分割,以及点云、多模态、模型轻量化和部署方向,一线项目经历丰富,具备高水平的Python、Pytorch等开发能力。计算机视觉,自然语言处理,高效模型压缩算法,多模态大语言模型,包括模型量化,剪枝,蒸馏,编译以及高效稀疏化训练与推理。,包括前沿论文精讲和代码演示,已有5000+人观看!

2025-04-08 10:38:20 26

转载 OCR+AI双引擎驱动:手把手教学构建智能财报分析系统

金融行业对精确的财报分析有着强烈的需求。这正是DeepSeek R1的强项,作为一款基于AI的财务分析工具,DeepSeek能够基于提取的数据自动进行深度分析,识别出财务报表中的关键风险、亮点和估值建议,帮助决策者做出明智的选择。通过合合信息TextIn的自动化文档解析与DeepSeek的财务分析,制造业能够迅速获取财报中的核心数据,识别财务风险,并优化资源配置,提高运营效率。TextIn的通用文档解析功能,特别适用于PDF格式的财报文件,通过高度优化的算法,它可以高效地从扫描的财务报表中提取关键信息。

2025-04-07 11:01:20 64

原创 YOLO12替换卷积 | AAAI 2025 | 风车形卷积(PConv)增强微弱小目标特征提取,显著增加接受野

Pinwheel-shaped Convolution(PConv)是一种新颖的卷积模块,旨在更好地与红外小目标的像素高斯空间分布对齐,增强特征提取能力,并显著增加感受野,同时只引入最小的参数增加。在SIRST-UAVB数据集上,PConv(4,3)配置提供了最佳和最平衡的性能提升,表明对于小目标,增加PConv核长度并不会带来额外的性能增益。在MSHNet分割模型中,PConv显著优于其他卷积模块,表明PConv核长度为4的配置在第一层提供了更有效的感受野,对于捕获小目标特征至关重要。

2025-03-29 10:28:23 988

转载 定制化训练DeepSeek模型:LoAR、COT推理与SFT技术应用

PEFT 包含了 LoRA 的实现,并且它使得你能够通过修改模型的一部分参数来进行高效微调,从而不需要调整整个模型的权重。:模型参数量相对较小(如 7B、13B、33B、65B),但通过高质量数据和训练方法,性能接近甚至超越更大的模型。: 当前训练的损失为14435.37,表明模型的表现尚不理想,通常需要更多的训练来降低损失。适用于各种 NLP 任务,尤其是在生成、问答、文本分类等任务中,具有较好的性能和效率。:Qwen 系列模型通常对中文有较好的支持,同时在英文和多语言任务上也有不错的表现。

2025-03-28 10:12:58 60

转载 基于YOLOv8n + OC-SORT + CRCM算法的百香果产量估算

为了验证这些方法的有效性,建立了一个真实世界的百香果视频数据集,其中包括24个视频,每个视频的长度为1分钟。在测试集上的检测结果中,YOLOv8n探测器在YOLOv5n、YOLOv7和YOLOv8n三种探测器中取得了最好的效果,mAP@0.5 (mean Average Precision)达到86.3%,模型大小仅为6.2 MB。综上所述,YOLOv8n + OC-SORT + CRCM算法有效解决了错误识别、小果漏检、重复计数等问题,实现了对百香果产量的稳定、实时、准确估计。笔记、代码清晰易懂!

2025-03-25 10:21:04 74

转载 YOLO12改进-引入​多维协作注意力MCAM 抗背景干扰,增强多尺度、小目标

其本质是让模型同时回答三个问题:“哪些特征重要”(通道维度)、“重要特征在垂直方向的位置”(高度维度)、“重要特征在水平方向的位置”(宽度维度),并将三者动态融合。例如,原始特征维度为“通道×高度×宽度”(如64×224×224),旋转后变为“高度×通道×宽度”(224×64×224),此时每个“伪通道”对应原始图像的一行像素。通过旋转操作将宽度维度转换为“伪通道”,例如原始特征变为“宽度×高度×通道”(224×224×64),每个“伪通道”对应原始图像的一列像素。

2025-03-24 10:16:41 131

转载 大语言模型低成本微调方法

QLoRA的双重量化就是对这个量化常数再做一次8bit的量化,在进行量化常数的量化时,QLoRA以每256个量化常数为一组再做一次量化。因此它额外增加的内存消耗有两部分组成,一部分是量化后的8bit的第一层的量化常数,第二部分是为量化常数做量化的第二层的32bit的量化常数。在神经网络中,预训练的权重通常具有零中心的正态分布,标准差为σ。PortLLM提供了一种无需训练的框架,这个框架基于最初的预训练模型进行微调以获得微调后的参数变化(模型补丁),并将模型补丁应用于后续更新的预训练模型以节约微调成本。

2025-03-17 22:29:31 72

转载 基于大语言模型的知识蒸馏

一句话解释:知识蒸馏是一种模型压缩技术(model compression technique),通过让小模型(学生模型)学习大模型(教师模型)的输出或中间表示,以在保持精度的同时减少计算量和存储需求。GAN中的鉴别器(discriminator)估计样本来自训练数据分布的概率,也就是找出数据中的假数据,而生成器(generator)试图使用生成的数据样本欺骗鉴别器,也就是生成更逼真于数据集的数据。②.选择种子知识作为输入(种子知识通常包括与教师LLM的引出技能或领域知识相关的小数据集或特定数据线索)。

2025-03-14 10:11:13 59

转载 开箱即用,小时级部署,手把手教你构建DeepSeek-V3推理模型

很多时候工程架构解决的是复杂性问题,对于 LLM 来说,模型结构相对固定,结构核心部分已经变成全手写以达成最佳性能,好像所有的 LLM 模型几乎可以使用同一套 API。AI推理需求即将爆发,甚至也可以说已经爆发的2025年,真正适配AI大模型大规模落地的底层AI infra应该是什么样的?DeepSeek V3 作为目前公开资料可以看到的最复杂、最精巧的大模型 infra 设计,紧密结合算法和In...

2025-03-10 10:11:01 64

转载 YOLOv8基于MGD的知识蒸馏

向AI转型的程序员都关注公众号 机器学习AI算法工程本篇文章将剪枝后的模型作为学生模型,剪枝前的模型作为教师模型对剪枝模型进行蒸馏,从而进一步提到轻量模型的性能。Channel-wise Distillation (CWD)问题和方法在计算机视觉任务中,图像分类只需要预测整张图像的类别,而密集预测需要对每个像素或对象进行预测,输出更丰富的结果,如语义分割、目标检测等。直接应用分类任务中的知识蒸馏方...

2025-03-07 10:20:21 112

转载 漫画趣解:彻底搞懂模型蒸馏!

向AI转型的程序员都关注公众号 机器学习AI算法工程在人工智能的浪潮中,一个新兴的名词——“模型蒸馏”正逐渐走进大众视野。尤其随着DeepSeek的火爆,模型蒸馏更是成为热议的话题。那么,什么是模型蒸馏呢?一、模型蒸馏的定义模型蒸馏,简而言之,就是把大模型学到的知识,用“浓缩”的方式传授给小模型的过程。这样做的目的,是在保证一定精度的基础上,大幅降低运算成本和硬件要求。以DeepSeek为例,满血...

2025-03-05 10:20:45 127

转载 YOLOv12入门教程

向AI转型的程序员都关注公众号 机器学习AI算法工程论文链接:https://arxiv.org/abs/2502.12524代码链接:https://github.com/sunsmarterjie/yolov12长期以来,增强YOLO框架的网络架构一直至关重要,但一直专注于基于cnn的改进,尽管注意力机制在建模能力方面已被证明具有优越性。这是因为基于注意力的模型无法匹配基于cnn的模型的速度。...

2025-03-02 11:10:23 152

转载 76个DeepSeek满血版平台使用链接,全网最全

向AI转型的程序员都关注公众号 机器学习AI算法工程1.DeepSeek官网使用方式:网页或者App均可访问地址:https://www.deepseek.com/费用:不限次数免费使用2.BetterYeah AI使用方式:网页搜索(https://ai.betteryeah.com/login?channel=home&register_source=/)可用模型:DeepSeekR1...

2025-02-27 18:50:22 2201

原创 实操Deepseek接入个人知识库

向AI转型的程序员都关注公众号 机器学习AI算法工程为什么要尝试给DeepSeek添加本地知识库呢?或许在我们OA系统中会出现一个AI小助手,我们会问它差旅费报销流程怎么走、合同流程怎么走、负责某某业务的同事的联系方式等等。当然,这应该是最简单的应用场景。时代变了!以前需要找好多个部门的专业人士了解的信息,未来用AI工具就能快速获取,并且是提炼总结后的内容。要实现这些功能,必然需要提供相关的资料内...

2025-02-26 10:10:27 1810

转载 大白话揭秘DeepSeek加速引擎FlashMLA:如何榨干H800显卡的极限性能?

向AI转型的程序员都关注公众号 机器学习AI算法工程在DeepSeek开源周的首日,一款名为FlashMLA的创新项目震撼发布。作为专为英伟达高端显卡(如H800)设计的加速引擎,FlashMLA旨在让大语言模型的推理速度实现飞跃,同时大幅降低资源消耗。这款“AI涡轮增压器”的发布,无疑为AI领域注入了一剂强心针。FlashMLA:为英伟达高端显卡量身打造FlashMLA是DeepSeek团队针对...

2025-02-25 10:10:26 154

转载 火山引擎:邀请可拿145元代金券,畅享671B DeepSeek R1!

✨从火山方舟接入DeepSeek API服务,享受大流量+低延迟+低成本服务:延迟低至20ms内,提供高达 500 万 TPM 的全网最高的初始限流,并且全网首家提供超过 50 亿初始离线tokens!✨现火山方舟大模型体验中心全新上线,免登录即可体验满血+联网版Deep Seek R1 模型及豆包最新版模型✨邀约活动同步进行中,邀请可拿3000万tokens,畅享671B DeepSeek R...

2025-02-24 10:11:02 178

转载 聪明人已经抓住deepseek风口发表SCI了

家人们,科研圈又有大新闻啦!已经有聪明人抓住了 DeepSeek 风口,成功发表 SCI 啦!一个来自意大利的研究团队,以超高的执行力迅速跟进热点。他们借助 DeepSeek 模型,在中科院 1 区、影响因子 6.5 分的 Resuscitation 期刊上发表了一篇 Letter 类型的稿件。最让人惊叹的是,从投稿到接收仅仅用了一天时间!这速度,简直让人望尘莫及。所以这次我整理了由清华大学出版的...

2025-02-21 10:24:47 44

转载 7个DeepSeek隐藏技巧,让打工人效率翻倍

向AI转型的程序员都关注公众号机器学习AI算法工程在当今AI盛行的时代,我们是否真正掌握了如何使用AI来提高效率呢?近日,一位朋友向我感叹:“AI虽然强大,但得到的答案往往不够准确,有时甚至答非所问。”这让我回想起初学驾驶时的情景:拥有一辆好车固然重要,但更重要的是掌握驾驶技巧。同样,拥有强大的AI工具并不足以保证高效,关键在于我们如何运用它。DeepSeek,作为2025年春节后横空出世的国产...

2025-02-20 10:11:06 137

转载 这10个平台DeepSeek打开就用,不卡,免费

向AI转型的程序员都关注公众号机器学习AI算法工程这个春节,DeepSeek可谓是大放异彩,火爆程度让官网都“卡到爆”,硅基流动都流不动了。为了让大家能够自由地使用DeepSeek,今天为大家精心挑选了10个可以畅用DeepSeek的平台。1. 官方满血版首推的自然是DeepSeek的官网和APP,这里可以使用到满血版的R1和V3模型,以及联网功能。官网在上午时段较为流畅,但下午和晚上可能会有些...

2025-02-18 10:01:25 657

转载 如何给本地部署的DeepSeek投喂数据,让他更懂你

向AI转型的程序员都关注公众号机器学习AI算法工程在上一篇文章中,我们说了怎么在本地部署DeepSeek。对本地部署DeepSeek感兴趣的小伙伴看过来。本地部署 DeepSeek:小白也能轻松搞定!解决DeepSeek服务器繁忙问题三:最为推荐一、用户端即时优化方案网络加速工具1.推荐使用迅游加速器或海豚加速器优化网络路径,缓解因网络拥堵导致的连接问题。以迅游为例:启动加速器后搜索"DeepS...

2025-02-17 10:03:01 1119

转载 本地部署 DeepSeek:小白也能轻松搞定!

向AI转型的程序员都关注公众号机器学习AI算法工程DeepSeek R1和V3 满血版671B最强性能!免部署,开箱即用!DeepSeek服务器忙,一招解决!使用链接https://cloud.siliconflow.cn/i/OmyFKL4nPyCharm接入DeepSeek实现辅助编程,吊打CursorDeepSeek-V3DeepSeek-V3是一个拥有671B参数的MoE模型,吞吐...

2025-02-16 10:36:52 552

转载 DeepSeek爆火,留给普通人的时间不多了

2025开年王炸,“deepseek”全球爆火,deepseek其强大的自动化和智能化能力,使得许多重复性、规则性的岗位面临被替代的风险。DeepSeek的开源和低成本特性,使得AI技术更加“平民化”,同时,跨领域的技能融合也成为趋势,这意味着,不管你是不是ai行业从业者,你都需要懂AI。DeepSeek的爆火确实给普通人带来了紧迫感,但同时也提供了新的机遇。抓住风口是非常重要的,这次我邀请了沃恩...

2025-02-13 10:10:36 37

转载 性能飞跃!TensorRT-YOLO灵活易用的 YOLO 部署工具

向AI转型的程序员都关注公众号机器学习AI算法工程一、核心升级亮点速览????多Context共享引擎:高效推理,最大化硬件资源利用率TensorRT-YOLO 6.0 引入了创新的多Context共享引擎机制,允许多个线程共享同一个Engine进行推理,最大化硬件资源利用率,同时显著降低内存占用。这一设计使得多任务并发推理更加高效,尤其适合需要同时处理多路视频流或大规模数据推理的场景。核心优势:权...

2025-02-10 10:07:27 130

转载 AutoGen:让DeepSeek和Qwen2.5自行聊天完成任务

向AI转型的程序员都关注公众号机器学习AI算法工程AutoGen介绍AutoGen 是一个开源编程框架,用于构建 AI 代理并促进多个代理之间的合作以解决问题。AutoGen 旨在提供一个易于使用和灵活的框架,以加速代理型 AI 的开发和研究,就像 PyTorch 之于深度学习。它提供了诸如代理之间可以对话、LLM 和工具使用支持、自主和人机协作工作流以及多代理对话模式等功能。主要特点AutoG...

2025-02-08 09:00:52 162

转载 如何用DeepSeek-R1蒸馏出属于你自己的大模型

向AI转型的程序员都关注公众号机器学习AI算法工程发现了一个新的fune-tune框架,可以在1小时内让DeepSeek-R1蒸馏出属于你自己的小模型,整个过程是全自动的,不需要编写代码或者手动调节,仅需定义你的数据集即可。这意味着假设你是一个医生,完全可以基于过往的病例,在本地使用DeepSeek-R1构建一个属于你自己的医学专业模型。参考文献:[1] 框架地址:https://github....

2025-02-07 08:46:04 59

转载 迈向GPT-4o,多模态大模型杀回来了!

多模态大模型是实现AGI的必经之路。它通过模拟人类的多模态感知能力,使模型能够更自然地与人类交互,理解人类的喜怒哀乐以及工作和生活习惯。在人工智能的浪潮中,多模态大语言模型(MLLM)正引领着一场深刻的变革。这次我整理了多模态论文700篇,还邀请了头部互联网企业算法专家,研发多模态大模型的Geoff老师,在2月13号晚8点给大家带来《深度解析比肩GPT-4o——实时交互多模态大模型VITA-1.5...

2025-02-06 10:10:53 37

转载 使用ChatGPT自动构建知识图谱

向AI转型的程序员都关注公众号机器学习AI算法工程1.概述本文将探讨利用OpenAI的gpt-3.5-turbo从原始文本构建知识图谱,通过LLM和RAG技术实现文本生成、问答和特定领域知识的高效提取,以获得有价值的洞察。在开始前,我们需要明确一些关键概念。2.内容2.1 什么是知识图谱?知识图谱是一种语义网络,它表示和连接现实世界中的实体,如人物、组织、物体、事件和概念。知识图谱由具有以下结构...

2025-02-05 11:38:37 77

转载 2025 最佳免费商用文本转语音模型: Kokoro TTS

向AI转型的程序员都关注公众号机器学习AI算法工程在文本转语音(TTS)技术领域,一项突破性的进展引起了广泛关注——Kokoro TTS 模型凭借其卓越性能和完全免费的商用许可,成为目前最出色的 TTS 解决方案之一。基于广受欢迎的开源框架 StyleTTS,Kokoro TTS 在灵活性和功能性上都表现出色,可广泛应用于多种场景。接下来,我们将深入探讨这个模型的独特之处、核心功能以及如何充分利...

2025-02-03 19:55:24 1032

转载 LLM大模型训练工具,小白也能轻松搞定!

向AI转型的程序员都关注公众号机器学习AI算法工程AxolotlAxolotl 是一款旨在简化各种人工智能模型微调的工具,支持多种配置和架构。主要特点:支持的常见开源大模型,多种训练方式,包括:全参微调、LoRA/QLoRA、xformers等。可通过 yaml 或 CLI 自定义配置。支持多种数据集格式以及自定义格式。集成了 xformer、flash attention、liger kern...

2025-01-31 12:05:05 88

转载 使用 cProfile 分析和定位 Python 应用性能瓶颈

向AI转型的程序员都关注公众号机器学习AI算法工程一、背景需求性能压测时,发现某接口存在性能瓶颈,期望借助工具定位该瓶颈,最好能定位至具体慢方法。二、cProfile 简介cProfile 是 Python 标准库中的一个模块,用于对 Python 程序进行性能分析,它能输出每个函数的调用次数、执行耗时等详细信息,可帮助开发者识别程序中运行缓慢的方法,以便进行性能优化,适合作为上述需求的解决方案...

2025-01-30 10:12:24 103

转载 多模型专家组合(COE)的关键实现方法,deepseek也在用

向AI转型的程序员都关注公众号机器学习AI算法工程1.概述在当前的人工智能发展中,单一模型的表现往往难以满足复杂任务的需求。为应对这些挑战,多模型协作的方法应运而生,“专家组合”(Mixture of Experts)便是其中一种有效的模型协作方法。专家组合不仅能提升模型的准确性,还能通过合理分工提升效率,提供跨领域的综合解决方案。本文将从多个角度探讨专家组合的概念、实现方法、实际应用场景以及未...

2025-01-29 20:30:54 124

转载 DeepSeek V3 两周使用总结

向AI转型的程序员都关注公众号机器学习AI算法工程2024 年 12 月 26 日,杭州深度求索人工智能基础技术研究有限公司发布 DeepSeek-V3 大模型。官方宣称:(1)基于自研的 MoE 模型和 671B 参数,在 14.8T token 上进行了预训练;(2)多项评测成绩超越了 Qwen2.5 - 72B 和 Llama - 3.1 - 405B 等其他开源模型,在性能上与世界顶尖的...

2025-01-25 10:10:46 236

转载 ChatGPT搭建AI网站实战

向AI转型的程序员都关注公众号机器学习AI算法工程1.概述ChatGPT是一款基于GPT-3.5架构的大型语言模型,它能够进行自然语言处理和生成对话等任务。作为一款智能化的聊天机器人,ChatGPT有着广泛的应用场景,如在线客服、智能助手、个性化推荐等。今天笔者给大家分享一下如何使用ChatGPT的API模型快速搭建一个AI网站。2.内容在实战中,我发现ChatGPT的最大优势在于其自然流畅的对...

2025-01-24 10:10:44 51

转载 TensorRT-YOLO:灵活易用的 YOLO 部署工具

向AI转型的程序员都关注公众号机器学习AI算法工程TensorRT-YOLO 是一款专为 NVIDIA 设备设计的易用灵活、极致高效的YOLO系列推理部署工具。项目不仅集成了 TensorRT 插件以增强后处理效果,还使用了 CUDA 核函数以及 CUDA 图来加速推理。TensorRT-YOLO 提供了 C++ 和 Python 推理的支持,旨在提供????开箱即用的部署体验。包括目标检测、实例分...

2025-01-22 10:11:15 89

转载 提升大语言模型的三大策略

向AI转型的程序员都关注公众号机器学习AI算法工程1.概述随着大语言模型(LLMs)在技术和应用上的不断发展,它们已经深刻地改变了我们与计算机的互动方式。从文本生成到语言理解,LLMs的应用几乎涵盖了各个行业。然而,尽管这些模型已展现出令人印象深刻的能力,如何将它们真正适配到自己特定的业务需求中,仍然是一个复杂且充满挑战的任务。比如,Llama 2的发布让LLM在性能上逼近甚至有潜力超越Chat...

2025-01-21 10:11:08 115

电动车佩戴头盔检测数据集(TWHD)

电动车佩戴头盔检测数据集(TWHD) 数据集已经按照VOC格式进行整理,可以直接通过labelImg读取打开查看相关的标注信息。图像分辨率不一,总体在1080P以下,不区分训练集和测试集,总计5448张图像样本与标注xml文件。数据集标注共三个类别: two_wheeler,二轮车主体,黄色框 helmet,佩戴头盔的头部,绿色框 without_helmet,未戴头盔的头部,红色框

2024-03-02

目标检测yolov系列半自动标注数据集代码

目标检测yolov系列半自动标注数据集代码。如果待标注数据集量大,可以先手动标注少量,然后训练出初版目标检测模型,然后用初版模型预测进行预标注,最后人工检查预标注,修正误检标注。 步骤: 1.将待标注图像放入auto_label/images 2.修改auto_label.py的第62至65行如下的内容: path = r"auto_label/images" #待标注图片路径 xml_path = r"auto_label/images" #输出的xml标注文件保存路径 yolo_model_weight='./weight/IDCard_v6x_best.pt' #模型文件路径 data_conf = './data/custom_data.yaml' #数据集配置文件路径 3.运行auto_label.py

2024-03-01

python目标检测数据增强代码VOC格式转换为COCO格式代码

python目标检测数据增强代码,增强方式包含裁剪(需改变bbox)、平移(需改变bbox)、改变亮度、加噪声、旋转角度(需要改变bbox)、镜像(需要改变bbox)、cutout等。 同时也包含了将VOC格式数据集转换为COCO格式的代码。代码适合用于各种计算机视觉目标检测数据集增强,增广数据集,增加检测模型鲁棒性,减小模型漏检、误检等情况,适合用于YOLO系列模型,YOLOv1到YOLOv9训练。

2024-03-01

COCO API的安装包 cocoapi.zip 安装pycocotools

COCO API的完整安装包,带_mask.c文件 cocoapi.zip,安装pycocotools

2021-09-10

libstdc++.so.6.0.23下载

顺利解决/usr/lib64/libstdc++.so.6: version `CXXABI_1.3.8‘ not found

2021-08-05

Cube-IQ-使用方法_图文说明_使用步骤.docx

Cube-IQ-使用方法_图文说明,Cube iq使用方法,Cube iq 装载优化软件,Cube iq使用步骤Cubeiq 使用方法 newload 创建装载方案 比如装载casio ,可以设装载项目为casio

2021-05-05

TensorRT-7.0.0.11.CentOS-7.6.x86_64-gnu.cuda-10.0.cudnn7.6.txt

百度网盘下载链接 TensorRT-7.0.0.11.CentOS-7.6.x86_64-gnu.cuda-10.0.cudnn7.6.tar.gz TensorRT-7.0.0.11.CentOS-7.6.x86_64-gnu.cuda-10.2.cudnn7.6.tar.gz

2021-04-10

Deep Learning for NLP with TensorFlow2.0.zip

最新基于TensorFlow 2.0的NLP实操介绍,重点介绍Embeddings,seq2seq,attention和神经机器翻译等经典的NLP主题,以及Transformer、BERT和XLNet等现代深度学习架构.

2020-07-10

linux系统(Ubuntu)已编译darknet(cpu版)直接可用

linux系统(Ubuntu)已编译darknet(cpu版),包含libdarknet.so等文件,下载下来直接可用,成功测试yolo3。

2020-02-27

darknet_windows.rar已编译直接可用yolo3

windows下darknet(CPU版本)已经编译好,包含libdarknet.so等文件,已经编译好,直接可以用,已经测试成功使用YOLO3

2020-02-27

Python3语法速查本PDF.zip

Python3语法速查本

2019-12-05

阿里巴巴机器智能技术精选合集.PDF

阿里巴巴在 AAAI 2018 上也收获了 11 篇录用论文,分别来自 iDST、 业务平台事业部、阿里妈妈事业部、人工智能实验室、云零售事业部,其 中有 5 位作者受邀在主会做 Oral 形式报告,另有 1 位作者携两篇论文在 主会以 Poster 形式做报告。论文内容涉及对抗学习、神经网络、提高轻 量网络性能的训练框架、聊天机器人、无监督学习框架、极限低比特神经 网络等技术方向。

2019-12-05

图片分类数据集(17类花朵)

图像分类数据集:17个类别的花朵数据集,训练集800张,验证集和测试集260张

2019-09-18

语义相似度任务-LCQMC数据集下载lcqmc.zip

语义相似度任务-LCQMC数据集下载。LCQMC 是哈尔滨工业大学在自然语言处理国际顶会 COLING2018 构建的问题语义匹配数据集,其目标是判断两个问题的语义是否相同。

2019-07-28

GoogleNews-vectors-negative300.bin.gz

GoogleNews-vectors-negative300.bin.gz是word2vec提前训练好的model。

2019-07-20

HanLp数据字典(1.7.1)

汉语言处理包中的data.zip数据,github上下载速度有点慢,这里提供下载。其他相关资源可从官网上下载jar包及配置文件。

2019-03-26

细粒度用户评论情感分析数据集(2018-AI-challenger)

共包含6大类20个细粒度要素的情感倾向.数据集分为训练、验证、测试A与测试B四部分。数据集中的评价对象按照粒度不同划分为两个层次,层次一为粗粒度的评价对象,例如评论文本中涉及的服务、位置等要素;层次二为细粒度的情感对象,例如“服务”属性中的“服务人员态度”、“排队等候时间”等细粒度要素。每个细粒度要素的情感倾向有四种状态:正向、中性、负向、未提及.

2019-03-23

阿里天池FashionAI服装属性标签图像识别Top1-5方案分享

阿里天池FashionAI服装属性标签图像识别Top1-5方案分享

2019-01-06

吴恩达深度学习课程-神经网络和深度学习

吴恩达深度学习课程-神经网络和深度学习。

2018-11-28

Kaggle自然语言处理文本匹配竞赛华人第1名团队PPT与代码-深度学习与特征工程

Kaggle自然语言处理文本匹配竞赛华人第1名团队PPT-深度学习与特征工程,代码仓库地址在ppt 内

2018-11-28

pythons爬虫_抓取微信公众号 历史文章

pythons爬虫:抓取微信公众号 历史文章

2017-08-20

爬取P2P网站

爬取P2P网站

2017-08-20

python图片下载器

python图片下载,传入图片url,将图片保存在本地

2017-08-11

python字符串处理去掉符号加空格

# 1、去掉特殊符号".","","#"; # 2、去掉中间多余空格; # 3、去掉首尾空格; # 4、中文与英文间添加空格

2017-08-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除