自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 问答 (13)
  • 收藏
  • 关注

原创 Whisper模型实现区分不同人物语言

Whisper本身不具备区分不同说话人的功能,但可以结合其他音频处理技术实现说话人分离(Speaker Diarization)。

2025-05-27 11:02:08 205

原创 Whisper(Openai)部署方案测试

Whisper 是 OpenAI 开发的开源语音识别模型,具备强大的多语言处理能力和高精度转录效果,适用于多种音频类型。

2025-05-23 10:18:55 567

原创 PyTorch学习入门——张量(1)

PyTorch是由Facebook AI研究院于2017年推出的开源深度学习框架,以其动态计算图、Python友好的接口和强大的生态系统,成为科研和开发的首选工具。

2025-05-22 10:43:18 536

原创 python代码实现文本转换音频

gTTS(Google Text-to-Speech)是一个基于Google翻译API的Python库,能够将文本转换为语音并保存为MP3文件。gTTS的应用场景广泛,包括制作有声读物、开发语音助手、教育应用和无障碍功能等。尽管gTTS简单易用,但它需要联网。

2025-05-22 09:22:47 929

FPGA入门代码demo

基于野火zynq7010的3-8译码器verilog代码用于学习测试。

2025-05-22

人工智能创新大赛源码测试

2023中国人工智能大赛广西赛区入围作品

2025-05-21

原理图-PDF-STM32小车车V3.3.0_2022-12-27.pdf

原理图-PDF-STM32小车车V3.3.0_2022-12-27.pdf

2023-06-13

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除