本文是LLM系列文章,针对《Extracting chemical food safety hazards from the scientific literature automatically using large language models》的翻译。
摘要
过去几十年来,食品安全领域发表的科学文章数量持续增加。因此,食品安全专家不可能阅读所有与食品安全和食物链中危害发生有关的相关文献。然而,重要的是食品安全专家了解最新的发现,并能够以简单、简洁的方式获取这些信息。在这项研究中,提出了一种通过大型语言模型从科学文献中自动提取化学危害的方法。大语言模型开箱即用,应用于科学摘要;不需要额外的模型训练或大型计算集群。测试了三种不同的模型提示方式,以评估哪种方式最适合当前的任务。使用两种验证食品(绿叶蔬菜和贝类)对提示进行了优化,并使用三种测试食品(乳制品、玉米和鲑鱼)评估了最佳提示的最终性能。发现提示的具体措辞对结果有相当大的影响。将任务分解为更小的步骤的提示总体效果最佳。该提示的平均准确度达到 93%,并包含许多已纳入食品监测计划的化学污染物,验证了食品安全领域相关危害的成功检索。结果展示了大型语言模型对于从科学文献中自动提取信息的任务有多么有价值。