本文是LLM系列文章,针对《UrbanKGent: A Unified Large Language Model Agent Framework
for Urban Knowledge Graph Construction》的翻译。
UrbanKGent:一种用于城市知识图谱构建的统一的大型语言模型Agent框架
摘要
城市知识图谱最近作为一个新兴的构建块,从多源城市数据中提取关键知识,用于不同的城市应用场景。尽管城市知识图谱构建(UrbanKGC)有着良好的效益,但它仍然严重依赖人工,阻碍了其潜在的发展。本文提出了一个统一的大型语言模型代理框架UrbanKGent,用于城市知识图谱的构建。具体而言,我们首先通过异构感知和地理空间融合的指令生成,为UrbanKGC任务(如关系三元组提取和知识图谱填充)构建知识渊博的指令集。此外,我们提出了一个工具增强迭代轨迹细化模块来增强和细化从GPT-4中提取的轨迹。通过在Llama-2-13B上进行具有增广轨迹的混合指令微调,我们获得了UrbanKGC代理UrbanKGent-13B。我们使用人类和GPT-4自我评估对两个真实世界的数据集进行了全面评估。实验结果表明,UrbanKGent-13B不仅在UrbanKGC任务中显著优于21个基线,而且以大约20倍的成本超过了最先进的LLM GPT-4,超过了10%以上。我们部署UrbanKGent-13B来提供在线服务,与现有的基准相比,仅使用五分之一的数据,就可以构建一个关系丰富数千倍的UrbanKG。我们的数据、代码和开源UrbanKGC代理在https://github.com/usail-hkust/UrbanKGent可用。
1 引言
2 URBANKGC数据描述
3 前言
4 URBANKGC代理构建
5 实验
6 相关工作
7 结论
在这项工作中,我们提出了UrbanKGent,这是第一个具有大型语言模型(LLM)的自动UrbanKG构建代理框架。我们首先构建了一个知识渊博的指令集,用于不同的UrbanKGC任务。然后,我们提出了一个工具增强的迭代轨迹精化模块,以便于各种大型语言模型的指令调优。大量的实验结果证明了UrbanKGent在改进UrbanKGC任务方面的先进性。我们发布了UrbanKGent-13B,这是一种基于Llama-13B的代理,与用于UrbanKG构建的GPT-4相比,具有更低的延迟和成本。我们希望开源的UrbanKGent能够促进未来的城市知识图谱研究和更广泛的智能城市应用。
8 局限性和未来工作
尽管拟议的UrbanKGent-13B仅使用五分之一的数据就可以构建一个具有千倍关系的UrbanKG,但这项工作对构建UrbanKG的进一步应用演示具有局限性。此外,尽管GPT评估和人工评估已被实验证明是一致的,但这项工作中的评估方法是成本密集型的。尽管存在上述限制,我们希望开源的UrbanKGC代理能够促进更广泛的UrbanKG研究和广泛的智能城市应用。未来,我们将导出额外的图像模态数据,以进一步丰富UrbanKGC。