MiniMax-01 开源项目教程

最新推荐文章于 2025-05-01 11:10:13 发布

诸莹子Shelley

最新推荐文章于 2025-05-01 11:10:13 发布

阅读量343

点赞数 3

本文链接：https://blog.csdn.net/gitblog_00948/article/details/147084657

版权

MiniMax-01 开源项目教程

MiniMax-01 The official repo of MiniMax-Text-01 and MiniMax-VL-01, large-language-model & vision-language-model based on Linear Attention 项目地址: https://gitcode.com/gh_mirrors/mi/MiniMax-01

1. 项目介绍

MiniMax-01 是由 MiniMax-AI 开发的大型语言模型和视觉语言模型，包括 MiniMax-Text-01 和 MiniMax-VL-01 两个模型。MiniMax-Text-01 是一个拥有 4560 亿参数的强大语言模型，而 MiniMax-VL-01 则是一个增强视觉能力的多模态模型，基于 MiniMax-Text-01 并结合了视觉编码技术。

2. 项目快速启动

以下是 MiniMax-Text-01 的快速启动指南，演示如何加载模型和进行简单的文本生成。

首先，确保你已经安装了 transformers 库。

from transformers import AutoModelForCausalLM, AutoTokenizer, AutoConfig, QuantoConfig

# 加载模型配置
hf_config = AutoConfig.from_pretrained("MiniMaxAI/MiniMax-Text-01", trust_remote_code=True)

# 量化配置，推荐使用 int8
quantization_config = QuantoConfig(
    weights="int8",
    modules_to_not_convert=[
        "lm_head", "embed_tokens"
    ] + [
        f"model.layers.{i}.coefficient" for i in range(hf_config.num_hidden_layers)
    ] + [
        f"model.layers.{i}.block_sparse_moe.gate" for i in range(hf_config.num_hidden_layers)
    ]
)

# 假设有 8 张 GPU
world_size = 8
layers_per_device = hf_config.num_hidden_layers // world_size

# 设置设备映射
device_map = {
    'model.embed_tokens': 'cuda:0',
    'model.norm': f'cuda:{world_size - 1}',
    'lm_head': f'cuda:{world_size - 1}'
}

for i in range(world_size):
    for j in range(layers_per_device):
        pass  # 此处省略了具体的设备分配代码

# 加载模型和分词器
tokenizer = AutoTokenizer.from_pretrained("MiniMaxAI/MiniMax-Text-01", trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained(
    "MiniMaxAI/MiniMax-Text-01",
    config=hf_config,
    quantization_config=quantization_config,
    device_map=device_map
)

# 生成文本
prompt = "你好，我是一个"
output = model.generate(tokenizer.encode(prompt, return_tensors="pt"), max_length=100)
print(tokenizer.decode(output[0], skip_special_tokens=True))