如何改善sphinx4中文识别率低的问题

1.项目引入依赖包

</dependencies>
    <dependency>
        <groupId>edu.cmu.sphinx</groupId>
        <artifactId>sphinx4-core</artifactId>
        <version>5prealpha-SNAPSHOT</version>
    </dependency>
</dependencies>
<repositories>
    <repository>
        <id>snapshots-repo</id>
        <url>https://oss.sonatype.org/content/repositories/snapshots</url>
        <releases>
            <enabled>false</enabled>
        </releases>
        <snapshots>
            <enabled>true</enabled>
        </snapshots>
    </repository>
</repositories>

2.下载最新的中文声学模型和字典

https://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/Mandarin/

cmusphinx-zh-cn-5.2.tar.gz

3.解压cmusphinx-zh-cn-5.2.tar.gz，并加入到项目resources目录。

4.执行代码

public class Speech2Text {
    public static void main(String[] args) throws IOException {
        Configuration configuration = new Configuration();
        configuration.setAcousticModelPath("resource:/cmusphinx-zh-cn-5.2/zh_cn.cd_cont_5000");
        configuration.setDictionaryPath("resource:/cmusphinx-zh-cn-5.2/zh_cn.dic");
        configuration.setLanguageModelPath("resource:/cmusphinx-zh-cn-5.2/zh_cn.lm.bin");
        StreamSpeechRecognizer recognizer = new StreamSpeechRecognizer(configuration);
        InputStream stream = new FileInputStream("E:/collection_0.wav");
        recognizer.startRecognition(stream);

        SpeechResult result;
        while ((result = recognizer.getResult()) != null) {
            System.out.format("Hypothesis: %s\n", result.getHypothesis());
        }
    }
}

E:/collection_0.wav是一段教学音频文件，程序运行，能识别并输出中文文本，但就是识别率太低了。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
疯狂de攻城狮 2021-03-03 22:00
关注
问题已解决，谢谢

解决
无用 1
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python基于SpeechRecognition-PocketSphinx实现简单语音识别
2022-06-07 23:20

月鹿玖醚的博客新人的第一个项目：python基于SpeechRecognition-PocketSphinx实现简单语音识别
使用PocketSphinx进行语音识别的详细指南
2023-09-19 09:39

ZrElixir的博客请记住，在使用PocketSphinx时，选择适当的声学模型、语言模型和字典对于获得准确的识别结果很重要。PocketSphinx是一个开源的自动语音识别（ASR）引擎，它被广泛应用于语音识别任务。本文将为您介绍如何使用Pocket...
语音识别基础篇(三) - pocketsphinx在windows下的中文语音识别
2018-01-08 10:49

itas109的博客语音识别基础篇(三) - pocketsphinx在windows下的中文语音识别如需转载请标明出处：http://blog.csdn.net/itas109 QQ技术交流群：12951803 相关文章语音识别基础篇(一) - CMU Sphinx简介语音...
AI人工智能语音识别技术的硬件设备选择
2025-04-24 17:13

AI智能探索者的博客 AI人工智能语音识别技术在当今科技领域扮演着至关重要的角色，它广泛应用于智能家居、智能车载、智能客服等众多场景。选择合适的硬件设备对于实现高效、准确的语音识别至关重要。本文的目的在于为读者提供全面、系统...
python基于PocketSphinx实现简单语音识别
2020-10-17 02:21

疯人忠的博客 pyhton基于PocketSphinx实现简单语音识别源码网址：PocketSphinx_Speech_Recognition 一、实现环境系统环境：win 10 编译环境：Pycharm 2020.1.4 x64 编程语言：python 3.8.3 依赖库的版本： SpeechRecognition ...
cmusphinx-zh-cn-5.2和pocketsphinx源码
2023-03-02 14:27

在当今的科技世界中，语音识别技术已经成为人工智能领域的一个重要组成部分，它为人类与机器之间的交互提供了更为自然的方式。cmusphinx-zh-cn-5.2和pocketsphinx就是两个在中文语音识别领域具有显著影响力的开源...
Sphinx语音识别学习记录（四）-小范围语音中文识别
2013-07-02 23:42

newHung的博客 CMUSphinx系列目录关于中文识别网上很多都是学习自下面的博客，Sphinx武林秘籍(上) 但很多人照做之后纷纷表示识别不出来，我们猜测是某个参数设定错误或者版本变化导致的 ...然后最近我也看了几篇，查看思路...
基于pocketsphinx的ROS离线中文语音识别（自定义命令词）
2019-08-08 22:13

slam02∞的博客基于pocketsphinx的ROS离线中文语音识别（自定义命令词）本文主要是自己在借鉴了一些网上的关于pocketsphinx做ROS语音识别的博主（比如倔强不倒翁）的一些博文之后结合自己实践之后所做的一个应用总结（不知道为...
语音识别.zip_人工智能/神经网络/深度学习_C/C++_
2021-08-10 01:46

《基于C/C++的语音识别技术在人工智能领域的应用》语音识别是现代信息技术中的一个重要领域，它涉及到人工智能、神经网络和深度学习等多个高技术领域。本文将深入探讨这些技术在Windows平台上的应用，特别是通过...
PocketSphinx语音识别系统语言模型的训练和声学模型的改进
2019-09-16 15:58

chuifuhuo6864的博客 PocketSphinx语音识别系统语言模型的训练和声学模型的改进 zouxy09@qq.com http://blog.csdn.net/zouxy09 关于语音识别的基础知识和sphinx的知识，具体可以参考我的另外两篇博文：语音识别的基础知识与...
pocketsphinx 模型库_[转] PocketSphinx语音识别系统声学模型的训练与使用
2020-12-31 02:48

孕产训导师单sir的博客 PocketSphinx语音识别系统声学模型的训练与使用声学模型主要用于计算语音特征和每个发音模板之间的似然度。目的是为每个声学单元建立一套模型参数(通过不断地学习和改进得到最优的，也就是概率最大的一组HMM模型参数...
pocketsphinx中文语音包资源介绍：中文语音识别利器
2025-04-14 11:30

鲍霄翌Titus的博客 pocketsphinx中文语音包资源介绍：中文语音识别利器【下载地址】pocketsphinx中文语音包资源介绍本开源项目提供了一套完整的中文语音包资源，专为pocketsphinx语音识别工具设计。资源包含语音模型和声学...
绝区玖--人工智能物料清单 (AI BOM)
2024-07-10 14:44

RA AI衍生者训练营的博客从基础数据层到模型训练的复杂性，从部署策略到扩展基础设施，每个元素在人工智能生命周期中都发挥着至关重要的作用。端到端 AI 堆栈：包括数据、模型开发、基础设施、部署和监控层。训练过程：详细说明数据准备、...
PocketSphinx语音识别系统声学模型的训练与使用
2019-09-16 16:06

chuifuhuo6864的博客 PocketSphinx语音识别系统声学模型的训练与使用 zouxy09@qq.com http://blog.csdn.net/zouxy09 声学模型主要用于计算语音特征和每个发音模板之间的似然度。目的是为每个声学单元建立一套模型参数（通过...
【python的魅力】：教你如何用几行代码实现文本语音识别
2024-05-04 20:56

爱喝兽奶的荒天帝的博客这个库支持多种操作系统，包括 Windows、Linux 和 macOS，并且可以在没有互联网连接的情况下工作，因为它...语音识别技术，也被称为自动语音识别，目标是以电脑自动将人类的语音内容转换为相应的文字和文字转换为语音。
基于Mycroft人工智能框架的开源语音助手软件
2024-05-07 14:32

Mycroft是一个强大的开源人工智能框架，专注于构建语音识别和理解能力。它旨在为开发者和爱好者提供一个可自定义、可扩展的人工智能平台，用于创建自己的语音助手软件。这个开源项目不仅提供了基本的语音识别功能，...
[转] PocketSphinx语音识别系统声学模型的训练与使用
2019-10-03 23:15

awp7451的博客 PocketSphinx语音识别系统声学模型的训练与使用 zouxy09@qq.com http://blog.csdn.net/zouxy09 声学模型主要用于计算语音特征和每个发音模板之间的似然度。目的是为每个声学单元建立一套模型参数（通过不断...
语音识别与Python编程实践
2023-02-25 21:55

心随而动的博客语音识别技术的发展可追寻到20世纪50年代，贝尔实验室首次实现Audrey英文数字识别系统（可识别0——9单个数字英文识别），并且准确识别率达到90%以上。普林斯顿大学和麻省理工学院在同一时期也推出了少量词语的独立...
没有解决我的问题, 去提问

如何改善sphinx4中文识别率低的问题

1条回答 默认 最新

1条回答默认最新