大模型微调报错二

最新推荐文章于 2024-09-11 00:01:36 发布

reesn

最新推荐文章于 2024-09-11 00:01:36 发布

阅读量1k

点赞数 4

分类专栏：神经网络文章标签：深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/rstroller/article/details/136789129

版权

训练大模型Qwen15-05B-Chat-GPTQ-Int4
训练使用qwen1.5 sft：
命令：python finetune.py --model_name_or_path /llm/Qwen15-05B-Chat-GPTQ-Int4
–output_dir ./checkpoints
–model_max_length 512
–data_path /data/agi/dataset/train_0.5M_CN/output600.jsonl
–use_lora True
–per_device_train_batch_size 1
–q_lora True
–learning_rate 5e-4
运行报错：
ValueError: Found modules on cpu/disk. Using Exllama backend requires all the modules to be on GPU.You can deactivate exllama backend by setting disable_exllama=True in the quantization config object
处理：
1）修改finetune.py。

    model = AutoModelForCausalLM.from_pretrained(
        model_args.model_name_or_path,
        config=config,
        cache_dir=training_args.cache_dir,
        device_map=device_map,
        quantization_config=GPTQConfig(
            bits=4,
	    disable_exllama=True)  # 添加修改

最低0.47元/天解锁文章

博客等级

码龄10年

16
原创

40
点赞

68
收藏

41
粉丝

关注

私信

热门文章

分类专栏

神经网络 2篇
c/c++ 2篇
前端 2篇
linux 3篇
rust 2篇
golang 1篇
协议 2篇

展开全部收起

最新评论

WSL2+Ubuntu遇到0x80370114错误
wjm041006: 这个确实可以的，但是好像需要重启一下
数字签名证书初识
CSDN-Ada助手: 不知道网络技能树是否可以帮到你：https://edu.csdn.net/skill/network?utm_source=AI_act_network
xformer\vllm与cuda版本
小星星starry: vllm亲测不能装0.2.0，需要0.1.7以下
入门大模型微调问题一
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
入门大模型微调问题一
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。