- 博客(170)
- 收藏
- 关注
原创 一文详解解读timm的使用方法,从新手变老手
`timm` 是由 Ross Wightman 创建的一个深度学习库,包含了一系列当下最先进(SOTA)的计算机视觉模型、层、工具、优化器、调度器、数据加载器、增强方法,以及用于复现 ImageNet 训练结果的训练/验证脚本。
2025-04-08 07:00:00
822
原创 一文详解PyTorch分布式训练中数据并行DDP的原理和代码实现
torch.nn.parallel.DistributedDataParallel (DDP) 透明地执行分布式数据并行训练。本页描述了其工作原理并揭示了实现细节。
2025-04-03 07:00:00
994
原创 1天入门一项新技术的道路:用拆分问题的方法使用DeepSeek平替DeepResearch进行信息搜索
本文演示如何使用DeepSeek快速了解一个陌生的领域技术,给读者提供一种思考方式和写提示词的方法,通过这种思考方式和提示词,可以快速得到类似于Deep Research的效果,快速搜索到自己想要的信息。
2025-03-24 07:00:00
698
原创 SpaCy官方中文教程:一文详解SpaCy的所有功能
文章完整地讲解了使用spaCy进行自然语言处理的功能,包括词性标注、词缀形态、词性还原、句法依赖解析器、命名实体抽取等等
2025-03-18 07:00:00
650
原创 详解大模型推理:从基础知识讲起
本文介绍了大型语言模型推理的各个方面。它首先解释了推理的基本概念,如预填充和解码阶段、在线和离线推理、基础(Grounding)等。然后详细讨论了推理性能的关键指标,包括延迟、吞吐量、第一个Token的时间(TTFT)和每个输出Token的时间(TPOT)。后面还深入探讨了模型内存使用情况,特别是KV Cache的重要性和计算方法。
2025-03-14 07:00:00
1739
原创 vLLM官方中文教程:使用vLLM的两种方式(离线推理和vllm server)
本文介绍了使用vllm推理框架的两种方式,离线推理和vllm server
2025-03-10 07:00:00
6281
原创 【干货】DeepSeek-V3和DeepSeek-R1官方中文部署文档(附详细资料和原文链接)
本文对DeepSeek官方英文部署文档进行手动中文翻译,并附上详细资料和原文链接
2025-03-03 07:00:00
2293
原创 Agent框架:AutoGPT入门介绍以及安装说明
文章介绍了OpenAI开源、用于构建Agent的Autogpt工具框架,包括入门说明和安装流程
2025-02-18 07:00:00
1717
原创 一文解读DeepSeek-R1论文技术突破点:纯强化学习训练带给模型顿悟的推理思考能力
DeepSeek-R1:纯强化学习训练带给模型顿悟思考推理能力
2025-02-17 07:00:00
1158
原创 OpenAI Deep Research被HuggingFace复现“开源”啦!!!
OpenAI闭源的Deep Research被HuggingFace复现“开源”了
2025-02-10 07:00:00
1988
原创 《DeepSeek》系列1:什么是DeepSeek?
文字介绍了DeepSeek及其DeepSeek系列模型,对没接触过DeepSeek的人做一个简单科普,后续会继续深入分析DeepSeek的技术创新
2025-02-05 07:00:00
1439
原创 《CLIP》论文精读:对比学习+大规模图文数据+自然语言为监督信号+VIT = CLIP
文字对CLIP论文的核心思想和方法进行了论文精读,核心思想对比学习+大规模图文数据+自然语言为监督信号+VIT=CLIP
2025-01-28 07:00:00
2242
原创 《Vision Transformer》论文精读:在大量足够数据量的条件下纯Transformer也能在图像分类任务中比肩SOTA
本文对论文VIT进行了详细的解读,论文表示:在数据集足够大的前提下,纯Transformer也能在图像分类任务、迁移任务中取得优异成绩
2025-01-27 07:00:00
1429
原创 《AnimateDiff》论文精读: 将运动动态添加到SD图像生成模型来生成动画视频
文章介绍了一种可以插拔的动画视频生成技术,通过将运动状态添加到高质量的个性化文本图像生成模型中实现
2025-01-21 07:00:00
763
原创 《Stable Video Diffusion》:SVD,2023年开源视频生成模型中的佼佼者!
在这篇文章中,我将面向之前已经熟悉StableDiffusion(SD)的读者,简要解读SVD的论文。
2025-01-20 07:00:00
1229
原创 《EfficientNetV2》论文精读:EfficientNet的续作,更小的模型更快的训练速度
本文介绍了 EfficientNetV2,这是一个新的用于图像识别的更小、更快的神经网络系列。主要手段(1)训练感知 NAS 和模型缩放和(2)改进的渐进式学习方法
2025-01-14 07:00:00
2052
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人