Llama3-Tutorial之XTuner微调Llama3图片理解多模态

原创

已于 2024-05-29 18:23:03 修改 · 722 阅读

9 ·

CC 4.0 BY-SA版权

文章标签：

#后端

于 2024-05-07 16:32:45 首次发布

Llama3-Tutorial之XTuner微调Llama3图片理解多模态

基于 Llama3-8B-Instruct 和 XTuner 团队预训练好的 Image Projector 微调自己的多模态图文理解模型 LLaVA。

参考：
https://github.com/SmartFlowAI/Llama3-Tutorial

1. 环境、模型、数据准备

1.1 配置环境

使用如下指令便可以安装好一个 python=3.10 pytorch=2.1.2+cu121 的基础环境。

conda create -n llama3 python=3.10
conda activate llama3
conda install pytorch==2.1.2 torchvision==0.16.2 torchaudio==2.1.2 pytorch-cuda=12.1 -c pytorch -c nvidia

接下来我们安装 XTuner。

cd ~
git clone -b v0.1.18 https://github.com/InternLM/XTuner
cd XTuner
pip install -e .[all]

如果已经配置好了环境，在这里也可以选择直接执行 conda activate llama3 以进入环境。

最后我们 clone 本教程仓库。

cd ~
git clone https://github.com/SmartFlowAI/Llama3-Tutorial

1.2 模型准备

1.2.1 准备 Llama3 权重

在微调开始前，我们首先来准备 Llama3-8B-Instruct 模型权重。

InternStudio

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

lldhsds

关注关注

4
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

专栏目录

Llama 3 微调项目实践与教程（XTuner 版）

强化学习曾小健

04-20

1626

到此为止我们就让 Llama3 具备了“他是由SmartFlowAI 打造的人工智能助手”的个人认知，本文演示平台为 InternStudio，如其他平台只需适当调整相关路径也能比较顺畅的运行起来，XTuner 玩转 Llama3 图片理解更多玩法请参考：https://github.com/SmartFlowAI/Llama3-XTuner-CN/ （欢迎 Star），同时本周天晚 8 点我们邀请了书生·浦语众多社区大佬一起来分享，欢迎预约直播一起讨论。或者软链接 InternStudio 中的模型。

书生·浦语大模型实战营之火爆 Reddit！多模态 Llama-3 它来了！！ XTuner 微调 Llama3 图片理解多模态

大模型与Agent智能体

04-23

272

书生·浦语大模型实战营之火爆 Reddit！多模态 Llama-3 它来了！！XTuner 微调 Llama3 图片理解多模态LLaVA-Llama-3-8B 已由 XTuner 团队推出，相比于 LLaVA-1.5，能力全面提升！(欢迎 Star)(欢迎 Star)

参与评论您还未登录，请先登录后发表或查看评论

一文实现Llama 3 图片理解能力微调（XTuner+LLaVA 版）

2301_80052071的博客

05-11

2846

—““DeepSpeed将当前时刻，训练模型用不到的参数，缓存到CPU中，等到要用到了，再从CPU挪到GPU。但随之的代价就是，更为频繁的CPU，GPU交互，极大增加了训练推理的时间开销”，这个说法不完全准确。这是因为相比GPU，CPU的内存通常更加充裕，而且CPU处理这些数据时虽然速度较慢，但在训练深度学习模型时，这部分计算通常不是性能瓶颈。相反，ZeRO技术通过分片（sharding）的方式，在多个GPU之间分散存储这些参数和状态，同时可能利用CPU内存来存储那些当前不需要直接参与计算的数据。

Llama3微调教程：超简单，人人都可以打造属于自己的GPT！

shadowcz007的博客

04-27

1452

随着Llama 3的发布，国内各路英雄豪杰纷纷开启了炼丹之旅。Llama-3 8b在惊人的15万亿令牌上训练，而Llama-2仅为2万亿。毋庸置疑，Llama 3目前是开源大模型中能力最强的！其跑分成绩已经赶上了GPT-4。然而，Llama的优势不仅限于此。作为开源大模型，每个人都可以对其进行定制，这意味着相比GPT，它具有更强的定制性和安全性。Llama可应用于针对B端企业的自然语言处理、机器翻...

『保姆级』大模型教程来了（从入门到实战）

2301_76168381的博客

04-01

5548

在大模型的构建之下，AI自动化交互，将会决定世界的未来，谁的大模型更强大，将决定在遥远的未来的话语权，同时，大模型会成为AI基础设施。AI大模型，正在构建的颠覆力，为了更好的入局AI大模型，🔻 针对ChatGLM大模型，介绍ChatGLM模型微调。🔻 大模型的定义和特点，如预训练、微调、指令学习等。🔻 05 精读大模型-3论文、Instruct论文。🔻 04 GLM-130B训练营——论文泛读。🔻 05 GLM-130B训练营——论文精读。🔻 08 Alpaca训练营——论文精读。

XTuner 微调 Llama3 图片理解多模态（InternStudio）

05-12

1213

本文参考。

第四课：【XTuner 微调个人小助手认知】笔记

qq_44407313的博客

04-19

1068

q1:为什么要微调？A:目前现有模型都是基座模型，是为了一般性任务进行预训练，运用于实际特定领域效果不佳，需要进行领域内微调q2:两种Finetune范式：A2:增量预训练微调：基座模型学习新知识（文章、书籍、代码）指令跟随微调：模型学会对话模板，根据人类质量进行对话（高质量对话，问答数据）高质量标注原始数据——>改为标准格式数据——>添加对话模板——>Tokenized数据——>添加Label——>开始训练标准数据格式添加对话模板，不同厂家有不同的模板。

LMDeploy高效部署Llama-3-8B，1.8倍vLLM推理效率

qq_39967751的博客

04-26

2757

Llama 3 近期重磅发布，发布了 8B 和 70B 参数量的模型，LMDeploy 对 Llama 3 部署进行了光速支持，同时对 LMDeploy 推理 Llama 3 进行了测试，在公平比较的条件下推理效率是 vLLM 的 1.8 倍。书生·浦语和机智流社区同学光速投稿了 LMDeploy 高效量化部署 Llama 3，欢迎 Star。本文将分为以下几个部分来介绍，如何使用LMDeploy来部署 Llama3（以 InternStudio 的环境为例）环境、模型准备。

Llama 3 | 三.Llama 3 图片理解能力微调（[XTuner](https://github.com/internLM/xtuner)+LLaVA 版）

m0_37634594的博客

05-18

486

问题2：What is the equipment in the image?问题1：Describe this image.30%的A100不够用，加上offload。训练报错，先安装deepspeed，重试。InternStudio软连接。

推荐一个图片识别的llama3微调版本清华面壁项目

robinfoxnan的专栏

06-03

1327

图文识别类的模型

使用Llama3增强高质量图像生成

m0_59164304的博客

06-21

1万+

Llama 3是Meta推出的大型语言模型（LLM）。在特定条件下可以免费商用（每月最多7亿次请求）。Meta Llama 3的版本从8B到400B不等，超过了谷歌的Gemma/Gemini、Mistral和Claude 3 Sonnet等可比模型，能够在4GB GPU上高效运行。

AI大模型企业应用实战：Prompt让LLM理解知识

2401_84204413的博客

06-25

2680

消费级 GPU 微调Llama 3 ：百万规模数据 (附数据&源码)

m0_59235699的博客

05-13

1778

注意，如果您增加了GPU的数量，请更新num_processes现在让我们运行加速器命令来开始训练，

【实战教程】手把手教你微调热门大模型 Llama 3

2401_85375186的博客

08-15

2217

Llama 3 近期重磅发布，发布了 8B 和 70B 参数量的模型，我们对 Llama 3 进行了微调！！！今天手把手教大家使用 XTuner 微调 Llama 3 模型。

微调llama 3 — PEFT微调和全量微调

xiaoxiaoyu290的博客

04-24

1万+

高效微调llama3

使用llama3.2-vision进行图片信息识别

冀辉的博客

12-05

1349

使用llama3.2大模型进行图片内容的提取取分析

llama3 微调教程之 llama factory 的安装部署与模型微调过程，模型量化和gguf转换。