轻量级解决方案：唤醒词检测+固定语音指令识别

最新推荐文章于 2025-04-15 00:29:10 发布

AI大权

最新推荐文章于 2025-04-15 00:29:10 发布

阅读量1.9k

点赞数 23

分类专栏：计算机视觉文章标签：语音识别人工智能

本文链接：https://blog.csdn.net/old_power/article/details/145566366

版权

如果需要在Linux上运行一个轻量级的解决方案，完成唤醒词检测和固定语音指令识别，以下是推荐的工具和框架组合：

1. 轻量级唤醒词检测

Snowboy

GitHub: https://github.com/Kitt-AI/snowboy
特点：
- 专为嵌入式设备和低功耗环境设计。
- 支持自定义唤醒词训练。
- 占用资源少，适合轻量级应用。
安装：
```
pip install snowboy
```
使用：
- 训练自定义唤醒词（通过Snowboy官网）。
- 使用Python脚本检测唤醒词。

Mycroft Precise

GitHub: https://github.com/MycroftAI/mycroft-precise
特点：
- 基于RNN的轻量级唤醒词检测工具。
- 支持自定义唤醒词训练。
- 适合Linux环境。
安装：
```
pip install mycroft-precise
```
使用：
- 收集唤醒词数据并训练模型。
- 使用训练好的模型进行唤醒词检测。

2. 固定语音指令识别

SpeechRecognition + PocketSphinx

SpeechRecognition GitHub: https://github.com/Uberi/speech_recognition
PocketSphinx: https://github.com/cmusphinx/pocketsphinx
特点：
- PocketSphinx是轻量级的语音识别引擎，适合固定指令识别。
- SpeechRecognition库提供了简单的API接口。

安装：

pip install SpeechRecognition
sudo apt-get install pocketsphinx

使用：
- 定义固定指令的语法文件（.gram 或 .jsgf）。
- 使用SpeechRecognition调用PocketSphinx进行识别。

Vosk

GitHub: https://github.com/alphacep/vosk

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

AI大权

关注关注

23
点赞
踩
20

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

嵌入式语音识别引擎介绍

05-25

嵌入式语音识别引擎介绍,先进的语音识别技术！

讯飞语音--唤醒Demo

zyr13520854072的博客

03-01

7010

写的第一篇博客,因为最近姐姐说起了一个段子, 一男子在地铁站手机找不到了,但是带了蓝牙耳机,耳机还有内容,男子想手机一定还在附近,随即大喊一句,悟空你在哪儿, 手机循环回答,我在这.....这时,拿手机那哥们回了男子一个尴尬而不失礼貌的微笑,哈哈所以我想起讯飞语音,就试着写了一下语音唤醒的Demo, 也借鉴了很多前辈的博客, 就不一一列举了,各位不喜勿喷接下来进入正题,首先在讯飞官网下载对应的SD...

参与评论您还未登录，请先登录后发表或查看评论

在树莓派上如何使用 Vosk检测唤醒词

Firmin123456的博客

03-21

921

Vosk 是一个轻量级的开源语音识别工具包，能在树莓派上高效运行。Vosk 本身主要是用于语音识别，不过可以借助它来实现简单的唤醒词检测功能。按照以上步骤操作，你就可以在树莓派上使用 Vosk 进行语音识别了。如果你想实现实时语音识别，可以结合。首先，你需要更新系统软件包列表，并且安装一些必要的依赖库。Vosk 支持多种语言，你需要根据自己的需求下载对应的语言模型。下载适合树莓派的模型。例如，若要进行中文唤醒词检测，可下载中文模型。是 Python 开发所需的头文件，则是用于音频输入输出的库。

唤醒词解决方案

人工智能

01-23

1041

唤醒词项目介绍 唤醒词：腾瑞腾瑞功能描述通过说出"腾瑞腾瑞"来唤醒hello.mp3里的音频内容，达到唤醒词的功能。通过人工智能（AI）的不同的技术手段来实现这个功能！！！

Alexa SDK庖丁解牛-第四回：唤醒词流程

yudongsia的专栏

01-26

3284

本次介绍alexa唤醒词模块： 1）使用portaudio库来管理音频采集、音频存储，音频采集后通过回调函数存储到共享内存模块sharedDataStream： std::shared_ptr micWrapper = alexaClientSDK::sampleApp::PortAudioMicrophoneWrapper::create(sharedDataStream); 2）初始化

pocketsphinx-go:用于Golang的CMU PocketSphinx，一种轻量级的语音识别引擎

05-07

CMUSphinx for Golang 介绍收集了20多年的CMU研究。所有优点都很难列举，仅举几例：先进的语音识别算法，可进行有效的语音识别。 CMUSphinx工具专为低资源平台而设计；灵活的设计；专注于实际应用程序开发，而不是研究；支持多种语言，例如美国英语，英国英语，法语，普通话，德语，荷兰语，俄语，以及能够为其他语言建立模型的能力；类似于BSD的许可证，允许商业发行；积极的开发和发布时间表；活跃的社区（Linkedin CMUSphinx组有400多个用户）；多种工具可用于许多与语音识别相关的目的（关键字识别，对齐，发音评估）。有关更多信息，请参考。这个项目 pocketsphinx-go项目的主要目的是将所有这些功能引入Go编程语言。首先，通过框架，我只需几个小时的配置调整就可以创建与Pocketsphinx核心库和sphinxb

推荐项目：DistilWhisper - 轻量级语音识别模型

gitblog_00028的博客

04-25

813

推荐项目：Normal Hark Lite - 轻量级语音识别库

gitblog_00045的博客

04-24

403

使用Sinc卷积从原始音频数据进行轻量级的端到端语音识别

暮木的博客

03-10

1504

论文： Lightweight End-to-End Speech Recognition from Raw Audio Data Using Sinc-Convolutions 摘要：许多端到端自动语音识别（ASR）系统仍依赖于经过预处理的频域特征，这些特征是手工制作的以模仿人类的听力。集成可学习特征提取的最新进展推动了我们的工作。为此，文本提出了将Sinc卷积与深度卷积相结合的轻型Sinc卷积（LSC），作为端到端ASR系统的低参数机器学习特征提取。本文将LSC(轻型Sinc卷积)融合进C.

【IOT】轻量级语音识别框架汇总

wangbotao1990的专栏

08-07

1851

一：Picovoice https://github.com/Picovoice/Porcupine 二：MycroftAI https://github.com/MycroftAI/mycroft-precise 在线语音助手一：AVS https://github.com/alexa/avs-device-sdk 二：ESP32 https://github.com/e...

mywords.pmdl "小科小科"唤醒词的训练模板

05-14

mywords.pmdl "小科小科"唤醒词的训练模板

cpp-由深度学习驱动的设备唤醒词检测引擎

08-16

由深度学习驱动的设备唤醒词检测引擎

豪猪：基于深度学习的设备上唤醒词检测

02-01

豪猪在加拿大温哥华制造豪猪是一种高精度，轻量级的唤醒单词引擎。它使您能够构建始终监听语音的应用程序。它是使用在实际环境中训练的深度神经网络。紧凑且计算效率高。它非常适合物联网。跨平台。支持Raspberry Pi，BeagleBone，Android，iOS，Linux（x86_64），macOS（x86_64），Windows（x86_64）和Web浏览器。此外，企业客户还可以访问ARM Cortex-M SDK。可扩展的。它可以检测多个始终监听的语音命令，而不会增加运行时占用空间。自助服务。开发人员可以使用训练自定义唤醒单词模型。此存储库中免费提供了所有主要语音助手（ Alexa ， Hey Google ， Ok Google和Hey Siri ）的豪猪唤醒单词模型（在Apache 2.0下）。目录许可条款 Porcupine SDK是免费的，并根据Apache 2.0（包括在存储库中发布的获得许可。提供两种类型的订阅：个人订阅和企业订阅。个人帐户可以训练在x86_64上运行的自定义唤醒单词模型，但要受限制并严格出于非商业目的。

豪猪唤醒词检测引擎：跨平台轻量级深度学习解决方案

豪猪（Porcupine）是一种利用深度学习技术实现的高精度、轻量级的唤醒词引擎。这种技术能够让应用程序始终保持对语音指令的监听，适用于构建类似于智能助手的功能，如Alexa、Hey Google、Ok Google和Hey Siri。 ###...

基于W800的AIOT离在线一体方案说明（阿里飞燕+离线语音控制）