freeswitch 科大讯飞、百度的语音识别(asr、tts) 参考

freeswitch 科大讯飞 语音识别(asr) 具体参考:

(如果你觉得实现下面麻烦可以到 https://item.taobao.com/item.htm?id=620078442889哦)

https://github.com/wangkaisine/mrcp-plugin-with-freeswitch/blob/master/README.md

1.asr写的很详细

2.tts使用方式

<extension name="unimrcp"> 
<condition field="destination_number" expression="^8520$">  

<action application="answer"/>

<action application="set" data="tts_engine=unimrcp:unimrcpserver-mrcp2"/>
 <action application="set" data="tts_voice=awb"/>
 <action application="sleep" data="500"/> 

 <action application="speak" data="李林您好我爱你"/>

 <action application="sleep" data="500"/> 
 <action application="lua" data="names.lua"/>
 </condition> </extension>

百度识别请参考https://ai.baidu.com/docs#/BICC-ASR-MrcpServer/top

创建应用注意权限

 

以上是基于unimrcp 的实现

以下基于mod_pocketsphinx 模块实现  主要实现switch_asr_interface_t 接口 

(如果你觉得实现麻烦可以到 https://item.taobao.com/item.htm?id=620078442889哦)

 此方式可以自定义控制 还可以对识别的pcm播放

  

测试

<extension name="asr">
      <condition field="destination_number" expression="^88888$">
        <action application="answer"/>
        <action application="log" data="===begin=="/>
        <action application="sleep" data="2000"/>
        <action application="log" data="ERR ===begin=="/>
        <action application="play_and_detect_speech" data="/usr/local/freeswitch/sounds/2.wav detect:pocketsphinx yes_no"/>
        <action application="log" data="===${detect_speech_result}"/> 
        <action application="sleep" data="2000"/>
      </condition>
    </extension>
play_and_detect_speech 如果播放声音不好的就播放个1s 静音 在次之前播放吧
效果

 

(如果你觉得实现麻烦可以到 https://item.taobao.com/item.htm?id=620078442889哦)

对此感兴趣的可以加群261074724 

### ASR PRO2.0 下载、安装与使用说明 #### 获取资源 对于希望获取并使用ASR PRO2.0的开发者而言,可以从指定项目地址下载所需材料[^1]。具体来说,访问链接 [GitCode](https://gitcode.com/open-source-toolkit/2a967),这里提供了完整的`ASR-PRO语音模块资料.zip`文档集合。 #### 准备硬件环境 为了顺利运行ASR PRO2.0,在开始之前需确认已准备好必要的物理组件,包括但不限于核心板、扬声器(喇叭)、麦克风(咪头),以及USB转TTL串口线作为下载工具来实现计算机同设备间的通信接口连接[^2]。 #### 软件配置 针对编程环境搭建方面,推荐采用官方支持的语言——天问Block图形化编程平台来进行开发工作。该IDE可通过官方网站 http://twen51.com 进行下载安装。完成上述准备工作之后,即可着手编写首个应用程序并向目标硬件部署固件镜像文件。 #### 编程实践指南 初次使用者可以参照提供的入门级实例代码进行练习,熟悉基本操作流程的同时也能够加深理解整个系统的运作机制。值得注意的是,在实际应用过程中如果遇到任何疑问或者困难之处,可以通过观看配套的教学视频获得进一步的帮助和支持[^3]。 #### 自定义语音功能 当涉及到个性化设置时,比如更改默认提示音效,则需要按照特定路径定位到对应的音频素材存储位置,并依照既定规则执行相应的替换动作以达到预期效果[^5]。 ```bash # 假设当前位于“天问Block”的根目录下 cd "C:\Program Files\Twain Block" cp ./ASRPRO/播报告警/*.wav ./ rm -rf ./ASRPRO/播报告警/* ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值