自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 问答 (1)
  • 收藏
  • 关注

原创 【笔记】MLA矩阵吸收分析

MLA矩阵吸收分析。

2025-05-30 08:19:55 260

原创 【论文解读】DeepSeek-V3

详细解读DeepSeek-V3原文。

2025-05-30 08:14:21 252

原创 【笔记】从策略梯度到PPO再到GRPO

从策略梯度到PPO到GRPO介绍。

2025-05-29 13:11:55 465

原创 【论文解读】YaRN

YaRN是一种高效扩展RoPE上下文窗口的方法,通过改进旋转位置嵌入来解决Transformer模型在处理超长序列时的性能下降问题。

2025-05-29 12:50:06 676

原创 【手撕系列】手撕Llama3

从零手撕llama3,并预训练和微调一个迷你llama。

2025-02-19 15:32:58 1259 1

原创 【手撕系列】手撕Transformer

从零手撕Transformer,并实现一个简单的中英翻译demo。

2025-02-19 14:07:48 1321 3

原创 【手撕系列】手撕语言模型汇总

手撕各种模型

2025-02-18 22:09:51 376

原创 Pytorch自定义快速傅里叶变换层(FFT Layer)

在一些网络中,需要实时将时域信号转换为频域信号,快速傅里叶变换(Fast Fourier Transform,FFT)是一种常用方法。本文主要介绍如何用pytorch实现FFT,并封装成一个自定义层,方便在一些需要时频变换的网络中即插即用。

2024-07-16 16:44:27 2055

原创 word修改自带公式字体

个人感觉Erewhon Math比较接近MathType默认的Times New Roman字体。

2024-06-03 15:21:03 7981 2

原创 为个人服务器设置局域网域名和开机自启Jupyter Lab服务

为个人服务器设置局域网域名和开机自启Jupyter Lab服务

2024-04-25 15:11:33 1081 1

原创 Pycharm配置远程解释器及远程Jupyter服务器

使用pycharm连接远程解释器或远程jupyter服务

2024-04-22 23:36:02 5405 5

原创 为个人服务器配置远程jupyter lab,并实现内网、外网访问

远程使用jupyter lab

2024-04-22 14:45:24 7392 2

word修改自带公式字体

word修改自带公式字体

2024-06-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除