RNN Transducer(RNN-T)——李宏毅人类语言处理学习笔记

(RNA)Recurrent Neural Aligner

其实他是在RNN-T之后被提出的,有点像CTC和RNA之间过度的方法。
CTC输出时是相互独立的,我们不想让他相互独立,让其在输出时看一看前面的东西。把Linear classifie换成rnn或者lstm即可,这就是rna。
在这里插入图片描述

RNN-T

RNA和CTC都是吃一个输入,输出一个token,那有时候我们需要吃一个输入,有多个输出,例如吃一个发音对应多个token,RNN-T便可以做这个事情。

一个输入进来,一直输出到Model觉得满意为止。有T个声音讯feature,输出T个Null,最终辨识的结果要把null拿掉。
在这里插入图片描述
RNN-T和CTC有同样的问题,需要知道何时输出null,但是这种Label在training是没有的,这种label需要自己去训练。
例如下图,你必须要在好棒之间插入四个null,RNN-T和CTC一样会穷举所有的element
在这里插入图片描述

实际上RNN-T会另外训练一个RNN,其作用有点像是一个language model,遇见null时忽略。
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

我是小蔡呀~~~

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值