UrbanKGent: A Unified Large Language Model Agent Framework for Urban Knowledge Graph Construction-CSDN博客

本文链接：https://blog.csdn.net/c_cpp_csharp/article/details/136505721

UrbanKGent是首个利用大型语言模型（LLM）自动构建城市知识图谱的框架。它通过知识丰富的指令集和工具增强的迭代轨迹细化模块，提升了关系三元组提取和知识图谱填充的效率。实验显示，UrbanKGent-13B在UrbanKGC任务上超越21个基线，以更低的成本和延迟超过GPT-4。该框架已开源，有望推动城市知识图谱和智能城市应用的研究。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本文是LLM系列文章，针对《UrbanKGent: A Unified Large Language Model Agent Framework
for Urban Knowledge Graph Construction》的翻译。

摘要

城市知识图谱最近作为一个新兴的构建块，从多源城市数据中提取关键知识，用于不同的城市应用场景。尽管城市知识图谱构建（UrbanKGC）有着良好的效益，但它仍然严重依赖人工，阻碍了其潜在的发展。本文提出了一个统一的大型语言模型代理框架UrbanKGent，用于城市知识图谱的构建。具体而言，我们首先通过异构感知和地理空间融合的指令生成，为UrbanKGC任务（如关系三元组提取和知识图谱填充）构建知识渊博的指令集。此外，我们提出了一个工具增强迭代轨迹细化模块来增强和细化从GPT-4中提取的轨迹。通过在Llama-2-13B上进行具有增广轨迹的混合指令微调，我们获得了UrbanKGC代理UrbanKGent-13B。我们使用人类和GPT-4自我评估对两个真实世界的数据集进行了全面评估。实验结果表明，UrbanKGent-13B不仅在UrbanKGC任务中显著优于21个基线，而且以大约20倍的成本超过了最先进的LLM GPT-4，超过了10%以上。我们部署UrbanKGent-13B来提供在线服务，与现有的基准相比，仅使用五分之一的数据，就可以构建一个关系丰富数千倍的UrbanKG。我们的数据、代码和开源UrbanKGC代理在https://github.com/usail-hkust/UrbanKGent可用。

1 引言

2 URBANKGC数据描述

3 前言

4 URBANKGC代理构建

5 实验

6 相关工作

7 结论

在这项工作中，我们提出了UrbanKGent，这是第一个具有大型语言模型（LLM）的自动UrbanKG构建代理框架。我们首先构建了一个知识渊博的指令集，用于不同的UrbanKGC任务。然后，我们提出了一个工具增强的迭代轨迹精化模块，以便于各种大型语言模型的指令调优。大量的实验结果证明了UrbanKGent在改进UrbanKGC任务方面的先进性。我们发布了UrbanKGent-13B，这是一种基于Llama-13B的代理，与用于UrbanKG构建的GPT-4相比，具有更低的延迟和成本。我们希望开源的UrbanKGent能够促进未来的城市知识图谱研究和更广泛的智能城市应用。

8 局限性和未来工作

尽管拟议的UrbanKGent-13B仅使用五分之一的数据就可以构建一个具有千倍关系的UrbanKG，但这项工作对构建UrbanKG的进一步应用演示具有局限性。此外，尽管GPT评估和人工评估已被实验证明是一致的，但这项工作中的评估方法是成本密集型的。尽管存在上述限制，我们希望开源的UrbanKGC代理能够促进更广泛的UrbanKG研究和广泛的智能城市应用。未来，我们将导出额外的图像模态数据，以进一步丰富UrbanKGC。