粤语识别语音模型

粤语识别语音模型

AI学习交流qq群873673497
官网turingevo.com
邮箱wmx@turingevo.com
githubhttps://github.com/turingevo
huggingfacehttps://huggingface.co/turingevo

原始模型

-id
modelscopeiic/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-pytorch

微调数据集

-id
modelscopemodelscope/speech_asr_commonvoice_cantonese-CHS_trainsets

微调结果

-id
huggingfaceturingevo/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-pytorch-lora

在这里插入图片描述

推理

common_voice_yue_31189594.wav 睇我几有礼貌去之前讲返声

# from funasr.runtime.python.onnx.runtime_recognizer import ONNXRuntimeRecognizer

input="/media/wmx/soft1/huggingface_cache/data/speech_asr_commonvoice_cantonese-CHS_trainsets/test/common_voice_yue_31189594.wav"
# input="/media/wmx/soft1/AI-model/FunASR/asr_example_zh.wav"
# input="/media/wmx/soft1/AI-model/FunASR/asr_example_en.wav"

model_dir="/media/wmx/soft1/huggingface_cache/out_models/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-pytorch-lora"
# model_dir="/media/wmx/soft1/huggingface_cache/hub/iic/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-pytorch"

from funasr import AutoModel

model = AutoModel(model=model_dir)

res = model.generate(input=input)
print(res)

result :

[
{'key': 'common_voice_yue_31189594', 
'text': '睇 我 几 有 礼 貌 去 之 前 返 声', 
'timestamp': [[1410, 1650], [1730, 1970], [2050, 2270], [2270, 2470], [2470, 2690], [2690, 2930], [3230, 3470], [3550, 3770], [3770, 4010], [4010, 4250], [4270, 4490]]}
]

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值