本文是LLM系列文章,针对《Rethinking the Roles of Large Language Models in Chinese Grammatical Error Correction》的翻译。
摘要
最近,大型语言模型(LLM)因其在各种下游NLP任务中的作用而被研究人员广泛研究。汉语语法纠错(CGEC)是NLP领域的一项基本任务,旨在纠正输入句子中所有潜在的语法错误。先前的研究表明,LLM作为CGEC校正器的表现仍然不令人满意,因为其任务重点具有挑战性。为了促进CGEC领域更好地适应LLM时代,我们重新思考LLM在CGEC任务中的作用,以便在CGEC中更好地利用和探索它们。考虑到LLM中存储的丰富语法知识及其强大的语义理解能力,我们利用LLM作为解释器,在纠错过程中为CGEC小模型提供解释信息,以提高性能。我们还使用LLM作为评估者,以带来更合理的CGEC评估,从而缓解CGEC任务主观性带来的麻烦。特别是,我们的工作也是对LLM和小型模型如何在下游任务中更好地协作的积极探索。广泛的实验和对广泛使用的数据集的详细分析验证了我们的直觉和所提出的方法的有效性。