Constructions Are So Difficult That Even Large Language Models Get Them Right for the Wrong Reasons

本文是LLM系列文章,针对《Constructions Are So Difficult That Even Large Language Models
Get Them Right for the Wrong Reasons》的翻译。

结构是如此困难,以至于即使是大型语言模型也会因为错误的原因而正确使用它们

摘要

在本文中,我们所做的贡献可以从两个角度来理解:从NLP的角度来看,我们为NLI引入了一个具有大词汇重叠的小挑战数据集,该数据集最大限度地减少了模型仅基于标记区分来识别隐含的可能性,并表明GPT-4和Llama 2在很大程度上不符合要求。然后,我们创建了更具挑战性的子任务来解释这一失败。从计算语言学的角度来看,我们识别出一组具有三类形容词的结构,这些形容词不能通过表面特征来区分。这使我们能够以各种方式探究LLM对这些结构的理解,我们发现它们在各种方式上都无法区分它们,这表明它们没有充分表达其含义或捕捉短语头的词汇特性。

1 引言

2 相关工作

3 数据集

4 自然语言推理

5 语法可接受

6 结论

总的来说,我们最引人注目的结果仍然是,LLM在我们的NLI任务中没有充分发挥作用,而这一结

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值