- 博客(4)
- 问答 (13)
- 收藏
- 关注
原创 Whisper模型实现区分不同人物语言
Whisper本身不具备区分不同说话人的功能,但可以结合其他音频处理技术实现说话人分离(Speaker Diarization)。
2025-05-27 11:02:08
205
原创 Whisper(Openai)部署方案测试
Whisper 是 OpenAI 开发的开源语音识别模型,具备强大的多语言处理能力和高精度转录效果,适用于多种音频类型。
2025-05-23 10:18:55
567
原创 PyTorch学习入门——张量(1)
PyTorch是由Facebook AI研究院于2017年推出的开源深度学习框架,以其动态计算图、Python友好的接口和强大的生态系统,成为科研和开发的首选工具。
2025-05-22 10:43:18
536
原创 python代码实现文本转换音频
gTTS(Google Text-to-Speech)是一个基于Google翻译API的Python库,能够将文本转换为语音并保存为MP3文件。gTTS的应用场景广泛,包括制作有声读物、开发语音助手、教育应用和无障碍功能等。尽管gTTS简单易用,但它需要联网。
2025-05-22 09:22:47
929
stm32播放多张图片
2023-08-17
树莓派日常开发stm32
2022-08-13
stm32寄存器操作是否可以等价
2022-08-08
stm32f103c8t6ADC寄存器
2022-07-29
日常stm32电机驱动异常
2022-07-08
中景园stm32历程异常
2022-06-24
可以买平板来鸿蒙开发吗?
2022-06-18
pwm输出异常(代码几乎做不到问题,无报错)
2022-06-04
嘉立创EDAPCB板设计
2022-05-24
stm32蓝牙模块硬件连接
2022-05-17
双系统(Windows和ubuntu)
2022-04-18
日常爬虫formatbug
2022-04-04
Google抓爬参数异常
2022-04-03
日常爬虫之sug异常
2022-04-03
双系统之无法启动qwq
2022-04-02
TA创建的收藏夹 TA关注的收藏夹
TA关注的人