David Hilbert-CSDN博客

原创 Whisper模型实现区分不同人物语言

Whisper本身不具备区分不同说话人的功能，但可以结合其他音频处理技术实现说话人分离（Speaker Diarization）。

2025-05-27 11:02:08 205

原创 Whisper(Openai)部署方案测试

Whisper 是 OpenAI 开发的开源语音识别模型，具备强大的多语言处理能力和高精度转录效果，适用于多种音频类型。

2025-05-23 10:18:55 567

原创 PyTorch学习入门——张量（1）

PyTorch是由Facebook AI研究院于2017年推出的开源深度学习框架，以其动态计算图、Python友好的接口和强大的生态系统，成为科研和开发的首选工具。

2025-05-22 10:43:18 536

原创 python代码实现文本转换音频

gTTS（Google Text-to-Speech）是一个基于Google翻译API的Python库，能够将文本转换为语音并保存为MP3文件。gTTS的应用场景广泛，包括制作有声读物、开发语音助手、教育应用和无障碍功能等。尽管gTTS简单易用，但它需要联网。

2025-05-22 09:22:47 929

FPGA入门代码demo

基于野火zynq7010的3-8译码器verilog代码用于学习测试。

2025-05-22

人工智能创新大赛源码测试

2023中国人工智能大赛广西赛区入围作品

2025-05-21

原理图-PDF-STM32小车车V3.3.0_2022-12-27.pdf

2023-06-13

stm32播放多张图片

2023-08-17

树莓派日常开发stm32

2022-08-13

stm32寄存器操作是否可以等价

2022-08-08

stm32f103c8t6ADC寄存器

2022-07-29

日常stm32电机驱动异常

2022-07-08

中景园stm32历程异常

2022-06-24

可以买平板来鸿蒙开发吗？

2022-06-18

pwm输出异常(代码几乎做不到问题，无报错)

2022-06-04

嘉立创EDAPCB板设计

2022-05-24

stm32蓝牙模块硬件连接

2022-05-17

双系统(Windows和ubuntu)

2022-04-18

日常爬虫formatbug

2022-04-04

Google抓爬参数异常

2022-04-03

日常爬虫之sug异常

2022-04-03

双系统之无法启动qwq

2022-04-02

TA创建的收藏夹 TA关注的收藏夹

TA关注的人