
AI 应用成长之路
文章平均质量分 74
董董灿是个攻城狮
阿里云社区专家博主,AI算法工程师
展开
-
DeepSeek 技术原理大揭秘,爆肝 10 小时,一篇就够!(1/3)
DeepSeek-R1 的训练过程也类似,如果直接用强化学习(RL)进行训练,那么 AI 一开始就会像一个“什么都不会的孩子”,不断犯错,生成一堆毫无逻辑的答案,甚至可能陷入无意义的循环。所以,可以认为 DeepSeek-R1 是在 R1-Zero 的基础上,通过额外的训练步骤优化了推理质量,避免了重复回答、提高了可读性,并且能更好地对齐人类偏好。可以看出,DeepSeek-R1 通过冷启动数据显著提升了数学推理、代码推理等任务的准确率,并且在生成答案的可读性上远超 DeepSeek-R1-Zero。原创 2025-02-06 10:16:57 · 1744 阅读 · 0 评论 -
DeepSeek 的含金量还在上升
CUDA 编程之所以说是英伟达软件生态的护城河,原因是英伟达的编译器对 CUDA 语言做了很多优化和适配,使 CUDA 编写的程序可以非常容易且高效的运行在 GPU 芯片上。CUDA 也是一样的,它本身也是一种类 C 语言的“高级语言”,说它高级是相对于底层汇编而言的,而非真正的高级语言。但虽然如此, CUDA 的护城河仍然存在,因为并不是所有的公司都能做到手写汇编,这里的技术壁垒还是挺高的。要想真正打破 CUDA 护城河,需要重新定义和建立新的芯片架构和编程范式,这一点在目前的情况下还是挺难的。原创 2025-02-04 20:13:09 · 6661 阅读 · 3 评论 -
零帧起手,我用 AI 做了一个谈琵琶的
大家好啊,我是董董灿。今天花了一个小时做了一个 AI 视频,大家先看成品。AI 弹琵琶视频中除了配乐,其余全部是 AI 做的。其实个人对这个视频不太满意,但是毕竟花的时间不长,从开始构思到成品总共不到1个小时。如果再多花一些时间,很多细节还可以做的更好。说下制作过程。原创 2025-01-11 19:35:47 · 579 阅读 · 0 评论