Qwen2.5-Coder Technical Report

UnknownBody

已于 2024-11-25 16:29:28 修改

阅读量345

点赞数 4

分类专栏： LLM Daily LLM for code Technical Report 文章标签：语言模型人工智能自然语言处理

于 2024-11-15 17:12:46 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/c_cpp_csharp/article/details/143803077

版权

LLM Daily 同时被 3 个专栏收录

1257 篇文章 ¥99.90 ¥299.90

订阅专栏

超级会员免费看

40 篇文章

订阅专栏

Technical Report

24 篇文章

订阅专栏

本文是LLM系列文章，针对《Qwen2.5-Coder Technical Report》的翻译。

摘要

在本报告中，我们介绍了 Qwen2.5-Coder 系列，这是其前身 CodeQwen1.5 的重大升级。该系列包括六款模型：Qwen2.5-Coder-（0.5B/1.5B/3B/7B/14B/32B）。作为特定于代码的模型，Qwen2.5-Coder 基于 Qwen2.5 架构构建，并在超过 5.5 万亿个token的庞大语料库上继续进行预训练。通过细致的数据清理、可扩展的合成数据生成和平衡的数据混合，Qwen2.5-Coder 展示了令人印象深刻的代码生成能力，同时保留了一般和数学技能。这些模型已经在各种与代码相关的任务上进行了评估，在 10 多个基准测试中实现了最先进的（SOTA）性能，包括代码生成、完成、推理和修复，性能始终优于相同模型大小的较大模型。我们相信，Qwen2.5-Coder 系列的发布将推进代码智能的研究，并通过其宽松的许可支持开发人员在实际应用程序中更广泛地采用。
在这里插入图片描述

1 引言

随着大语言模型（LLM）

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

UnknownBody 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。