Emergent Symbolic Mechanisms Support Abstract Reasoning in Large Language Models

UnknownBody

于 2025-03-05 09:00:00 发布

阅读量109

点赞数 2

CC 4.0 BY-SA版权

分类专栏： LLM Daily Causal and Reasoning 文章标签：语言模型人工智能自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/c_cpp_csharp/article/details/146015259

LLM Daily 同时被 2 个专栏收录

1288 篇文章 ¥99.90 ¥299.90

订阅专栏

超级会员免费看

Causal and Reasoning

101 篇文章

订阅专栏

本文是LLM系列文章，针对《Emergent Symbolic Mechanisms Support Abstract Reasoning in Large Language Models》的翻译。

涌现符号机制支持大型语言模型中的抽象推理

摘要
1 引言
5 讨论
主要内容
创新点

摘要

最近的许多研究都发现了大语言模型中出现推理能力的证据，但对于这些能力的稳健性，以及它们在多大程度上依赖于结构化推理机制，仍存在争议。为了阐明这些问题，我们对支持开源语言模型 Llama3-70B 中抽象规则归纳的内部机制进行了全面研究。我们识别出一种新兴的符号架构，它通过一系列三个计算步骤来实现抽象推理。在早期层中，符号抽象头基于输入token之间的关系将其转换为抽象变量。在中间层中，符号归纳头对这些抽象变量进行序列归纳。最后，在后期层中，检索头通过检索与预测的抽象变量相关联的值来预测下一个token。这些结果为符号主义和神经网络方法之间长期存在的争论提供了解决思路，表明神经网络中的新兴推理能力依赖于符号机制的出现。

1 引言

大语言模型已成为人工智能领域的主导范式，但关于其能力的局限性和可靠性仍存在大量争议。这场争论的一个主要焦点是它们是否能够以抽象或类似人类的方式进行系统推理。许多研究记录了大语言模型在各种推理任务上令人印象深刻的表现，在某些情况下甚至可以与人类表现相媲美，但其他研究对这些结论提出了质疑。特别是，语言模型在一些推理领域，如数学推理或规划中表现较差࿱

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

UnknownBody 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。