2025年AI大模型谁能笑到最后？-CSDN博客

本文链接：https://blog.csdn.net/androidstarjack/article/details/148621458

击上方关注 “终端研发部”

设为“星标”，和你一起掌握更多数据库知识

前几天对比了几个问题，国外的O3、Claude算是最好的，其次是grok。

国内的DeepSeek，qwen，其次就是kimi，豆包。

qwen，无论是微调还是推理都非常稳健，是我微调模型首选，

kimi，我处理长文本进行了比较，用下来kimi 128b的极好，如果充值的话，可以和幻觉的R1和V3相媲美。

Qwen不如豆包一坨，国内这些ai都处于“难用”状态，但架不住豆包最“人性化”，尤其是语音拟人，直接秒全场。豆包是最适合生活场景的。

这几个相信也一定能活下来的。现在也是事实意义上的三巨头。腾讯，华为，百度不会放弃大模型的研发，这仨现在虽然菜但是生态和基础设施都特别好，毕竟要么有庞大的数据池，产品基础和用户基础，要么有自研芯片的能力。

再说说智谱轻言，也是后起之秀的达模型来，一直在追赶，也不会放弃，毕竟自己有科研基础，但是没卡没钱没自己的产品形成闭环后续很难搞。

混元就是一坨，刚开始的时候，混元大模型的T1蠢得不行，是抄都抄不会，直接就是个跟跑，不掉队，等肉吃的，恶心人的主。现在直接接入了微信，前几天我体验了一把，现在也是越来越老了

有人说是deepSeek，也不是没有道理。

deepseek之前一直不如Qwen，哪知R1出来后，直接把Qwen碾压了，国内这波厂子，原本是百花齐放，被扫地僧默念全，直接被迫全部抄R1开源。从百花齐放，变成一枝独秀，现在国内这些AI 只要开深度思考，全是一股R1的中二科幻味。

毕竟Deepseek是开源的，这不那些欧洲人拿回去改改，就能换个名字卖钱了，然后欧洲牌子很多人还是相信的，现在可好了，欧洲那些家伙当然会说deepseek的好话。

这样一来，各个国家，各个大厂都可以部署自己的大模型，进行各种自动化的工作来尽可能的减少人工的操作了。。。。。。

但是有一点值得一提的是，deepSeek只是符合开源协议，并不是完全开源，而且一旦用了ds的技术架构，后续就会受制于ds，相当于为ds添砖加瓦，这正是ds喜闻乐见的，ds之所以开源，就是为了这个

至于国外，可能有人战队Google的gemini AI。

其实Google 很看重云业务，只要你用我的cloud,你的模型很强也可以～tpu使用成本比gpu便宜多了，就是jax写起来麻烦，不过a家这些初创用的也不少，你用a的模型Google 依然在后面赚。我觉得狗家吃相比Nvidia强太多了，这么多年各种服务都是划算的

对于数据而言，谷歌不仅整个互联网的文字数据，他还有互联网不同时期的文字数据，还有世界上最大的视频网站，所以谷歌的Gemini也是被大家看好的

有人在吹Claude，从我最近的一段时间来使用Claude3.7 gemini 2.5 pro还有qwen，各种用来对比，gemini的指令理解能力是最差的。

让总结个知识点，内容倒是问题不大，但是总是不按指令来。当然Gemini对长文本处理的能力和Claude差不多，这两者比其他的要强很多，代码能力还是Claude目前还是让我很满意的。

但是话说回来，在指令遵循方面，Claude确实还是最强，但是Gemini在debug尤其是复杂工程的debug上能力要强得多，可能是思维发散能力比较强。再加上现在免费而且百万token上下文，两个一起用其实是最舒服的

有人看重O3大模型,目前它的AI进度搞的很快，原本我还以为o3可能会保持一年左右的sora，毕竟gpt4保持了1年半，现在看估计几个月模型水平都能提升一个档次，o3满血版估计也就是4月份的sota，就像o3 mini接近满血版o1一样，推理可能更强，但知识可能差点上半年很可能被gpt5超越。下半年估计o系列还能再迭代1-2次，年底估计都是o5了

不管怎样，接下来，我相信会有更多的国家，更多的公司去打造自己的大模型。就像这次deepseek的开源真的是最好的阳谋。