挑战赛截至 2025 年 1 月 14 日。请抓住最后机遇,切勿错过截止时间。欢迎阅读本文,了解挑战赛的具体规则,期待看到您构建的精彩内容!
除非另有说明,否则所有截止日期均为协调世界时 (UTC) 当天晚上 11:59。竞赛组织者保留在必要时更新竞赛时间表的权利。
概览
诚邀您参加本次 Gemma 开放模型微调挑战赛,希望您能针对特定语言或文化背景对 Gemma 2 进行微调。制作清晰易懂且易于操作的 Notebook 内容,不仅有助于帮助其他人学习,还可以促进开发者开发适用于不同社区的语言模型。
🔗 Gemma 2
https://www.kaggle.com/models/google/gemma-2
说明
全世界有 7,000 多种语言和无数的文化差异,而 AI 具有促进全球理解的潜力。为了实现更广泛的语言包容性,我们特此举办 Kaggle 竞赛,重点面向 73 种符合条件的语言,鼓励开发者对 Google 的开放模型系列 Gemma 2 进行微调。这些语言的选择旨在代表多样化的范围,也可以让我们的评委小组能够从专业知识的角度进行有效的评估。我们对这些语言的初步关注将帮助我们建立强大的技术与资源基础,未来能够更好地支持资源匮乏的语言。
您需要在 Notebook 上记录微调 Gemma 2 的完整过程,包括:
数据集创建/管理:解释您是如何制作或管理用于微调的数据集的。详细信息包括有关数据源、预处理步骤以及与数据质量和文化敏感性相关的考虑事项。
对 Gemma 进行微调:提供所用微调方法的详细说明,包括超参数选择、训练过程以及用于提高性能的任何技术 (例如,少样本提示、检索增强生成)。
推理和评估