公司会倒闭，但大模型肯定不会

董董灿是个攻城狮

于 2023-11-19 10:46:30 发布

阅读量151

点赞数

分类专栏： chatGPT 文章标签：人工智能 chatgpt 算法深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dongtuoc/article/details/134487905

版权

chatGPT 专栏收录该内容

9 篇文章

订阅专栏

咋玩抖音的我，前几天在抖音上发了一张图片，没想到竟然有1000多的播放量。

当然这个播放量不算高，甚至在抖音的体系里属于很低的，但是比我预料的可能只有个位数的播放量是高了不少。

这张图片是我用某国产 AI 软件生成的，本意是想表达“将士军前半死生，美人帐前犹歌舞”的意境。

AI 画出来之后，我感觉配色和意境还不错，就发到了抖音上。

这里想说的是，大概几个月前，我曾经尝试过该国产模型绘画的能力，当时的感觉只能说是乏味可陈。

可如今，经过了这几个月的迭代，模型输出图片的能力却让我眼前一亮。

比如下面这张，我随意输入了帮我画“一个小孩在河边玩耍，需要水墨画风格”。

意境和配色感觉都还不错。

再比如下面这张，输入：“古风美女，面若桃花、柳叶弯眉”。

结果也还不错，至少意境是达到了。

一连串试了好几个，AI 的表现基本可以给70分以上了，而且生成速度很快。

虽然画质和细节处理可能还比不上国外跟牛的大模型比如 MJ，但是从国内大模型迭代的速度来看，我还是很看好的。

为什么大模型可以把一句话转换为图片呢？

我找到了一张图片可以解释这个问题。

这是 openai CLIP 模型的训练过程：左上是文本的输入，左下是图片的输入，

通过将文本输入和对应的图片输入相对比(在右侧的矩阵中找到文本和图像的相似性)，从而找到文本编码后的矩阵和图片编码后的矩阵的映射关系。

从而在文本生成图片时，图片部分通过解码器，便找到了文本和图片特征空间的对应，也就完成了文本到图片的生成，当然这只是粗略的解释，细节还可以继续深究。

总的来说就是需要找到文本和图像在模型中的一套统一的特征表示，或者特征的映射关系。

也就是说，文本和图片，在模型中有个第三者，两种之间的转换通过这个第三者来完成。

之前听到过一些说法，说大模型创业公司很多都会死去，最终可能只会剩下一两个大模型。

尤其是光年之外濒临破产被美团收购之后，这样的说法更多。

公司倒闭死去很正常，试问有哪一年哪个行业不会有一批创业公司死去呢？

但是体验了一下 AI 绘画之后，更加坚信了一点：公司会死，但大模型不会。

希望国产大模型继续加油~

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

董董灿是个攻城狮 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。