文章主要内容
本文提出了一种用于长文本叙事中角色关系提取的顺序多智能体大语言模型框架CREFT。该框架通过两个主要阶段处理叙事数据:首先利用知识蒸馏从文本块中提取主谓宾三元组,构建基础角色图;然后通过多个专门的LLM智能体依次优化角色组成、显式/隐式关系提取、角色识别和分组。实验在韩国电视剧数据集上表明,相比单智能体基线,CREFT在角色召回率、组匹配F1分数等指标上显著提升,尤其在处理别名合并、隐含关系和动态角色分组方面表现更优。研究还讨论了PPR算法在角色选择中的有效性,并指出组分配在模糊叙事中的挑战,为娱乐、出版和教育领域的叙事分析提供了高效工具。
创新点
- 顺序多智能体框架:通过分工明确的LLM智能体迭代优化角色关系提取的不同环节(如别名合并、关系分类、角色分组),突破单智能体在复杂任务中的局限性。
- 知识蒸馏构建基础图:使用GPT-4o生成标注数据,微调韩语LLM以安全提取三元组,避免直接调用LLM API的隐私问题。
- 系统化角色关系结构(CRS):