本文是LLM系列文章,针对《Towards Trustable Language Models: Investigating Information Quality of Large Language Models》的翻译。
走向可信任的语言模型:大型语言模型的信息质量研究
摘要
大型语言模型(LLM)正在快速生成信息,要求用户越来越依赖和信任数据。尽管LLM取得了显著的进步,但由于信息质量方面的挑战,LLM生成的信息并不完全可信。具体而言,由于LLM预训练期间的不可靠、有偏见的标记化,信息质量的完整性降低。此外,由于信息质量下降的问题,导致了信息的幻觉、捏造。不可靠的信息可能导致企业做出有缺陷的决策,从而影响经济活动。在这项工作中,我们介绍了LLM新的数学信息质量评估,我们进一步分析并强调了信息质量的挑战,系统地缩放语言模型的缩放规律。