
chatGPT
文章平均质量分 80
董董灿是个攻城狮
阿里云社区专家博主,AI算法工程师
展开
-
超简单,不用GPU,3步教你轻松在笔记本上部署聊天大模型 LLaMA
后来有人为了在传统 CPU 电脑上运行大模型,就开发了比较牛的框架,我们今天要用的,就是其中的一个明星产品:llama.cpp。大模型我们都不陌生了,但是以 chatGPT 为代表的大模型是闭源的,他们的源代码不开放,我们只能用他们的商业化产品。从上面的命令中我们可以看出,下载的是 llama-2-7b 模型,也就是有着 70 亿参数的那个模型。但是参数量大,就会对计算机的算力有更高的要求,因此很多大模型,基本部署都是要求在 GPU 上进行。原创 2024-01-17 21:24:50 · 3503 阅读 · 0 评论 -
两个阅读英文论文的免费AI工具
这种读论文的方法确实很好,但却忽略了一个很重要的问题:我的母语不是英语,很多时候每个单词都认识,但是连起来一连串长长的英文表达,尤其是专业英文表达,读起来还是佶屈聱牙。在GPT的加持下,目前读一篇崭新的英文论文,从原来可能需要1~2个小时,可以缩短到到现在的几十分钟,几乎就可以理解论文的大意了,很是方便。写论文的小伙伴可以关注一波,看着类似的工具,我有时就在想,如果我上学的时候有类似的工具,或许我还可以多发几篇论文呢。曾经有不少人分享过看论文的流程,比如首先看摘要,然后快速看论文框架,最后仔细看结论。原创 2024-01-12 23:19:16 · 1493 阅读 · 0 评论 -
为什么要用 top_p 做文本生成采样
Top_p采样,也称为核采样(nucleus sampling),是一种在自然语言生成中使用的文本采样策略。这里说的是一种采样策略,也就是从预测到的一堆可能的文本单词中,选择哪一个来作为最终输出的策略。原创 2023-12-17 10:50:42 · 3266 阅读 · 0 评论 -
通俗理解什么是 LSTM 神经网络
然后和上面经过遗忘门筛选过的信息相加,就得到了一个新的考高数时的知识库(在这里,有上一层(考完线性代数后)遗留下来的与高数考试相关的知识,比如加减乘除等通用运算知识,也有本次复习高数之后经过提纯的知识,比如微积分,可以说是必考题)。形象的解释一下这个过程:我们学习了高数的内容(xt),大脑中还保留了一部分上一场线性代数的内容,也就是隐藏状态(ht-1),这两个状态经过激活函数激活,选择性的保留,谁的权重大,那么谁最后保留下来的信息就多。可以认为是训练 LSTM 网络的事了。原创 2023-12-14 21:41:46 · 2329 阅读 · 1 评论 -
大模型微调的“温度”参数,原来影响的是 softmax
然后,softmax 函数将这些分数转换为概率(上面的链接查看具体过程),转换的过程就会使得分数较高的词的概率更高,而分数较低的词的概率更低,从而模型选择概率更高的单词作为输出。之前介绍过 softmax 这个函数,它的作用是将原始数据归一化到 0-1 之间的概率分布,并且拉开输入数据之间的差距,让大的数据概率变得更大,小的数据概率变得更小。上图展示了这个过程:在低温度下(黄色),softmax 输出的概率函数更加尖锐,意味着高分数的词语概率会更高,而低分数的词语概率会更低。今天就一起来了解一下吧。原创 2023-12-14 21:39:56 · 4897 阅读 · 0 评论 -
公司会倒闭,但大模型肯定不会
从而在文本生成图片时,图片部分通过解码器,便找到了文本和图片特征空间的对应,也就完成了文本到图片的生成,当然这只是粗略的解释,细节还可以继续深究。通过将文本输入和对应的图片输入相对比(在右侧的矩阵中找到文本和图像的相似性),从而找到文本编码后的矩阵和图片编码后的矩阵的映射关系。当然这个播放量不算高,甚至在抖音的体系里属于很低的,但是比我预料的可能只有个位数的播放量是高了不少。这里想说的是,大概几个月前,我曾经尝试过该国产模型绘画的能力,当时的感觉只能说是乏味可陈。结果也还不错,至少意境是达到了。原创 2023-11-19 10:46:30 · 151 阅读 · 0 评论 -
大模型是怎么知道 “我赚了200万” 的?
举个例子,我们可以把“苹果”这个单词映射成一个向量[0.2, 0.9, -0.1, ...],把“香蕉”映射成[0.5, -0.3, 0.8, ...],这样计算机在看到向量[0.2, 0.9, -0.1, ...]时,就能够理解这个单词是“苹果”了。如果我们只是用数字表示,那么计算机只能知道它们是不同的单词,无法确定“猫”和“狗”更相似,还是“鱼”和“跑”更相似,因为他们之间的数值都相差1。假设我们要对一篇文章中的单词进行编码,有四个单词:“猫”、“狗”、“鱼”、“跑”。原创 2023-11-19 10:45:06 · 229 阅读 · 0 评论 -
我也和 chatGPT 聊了聊
我也和 chatGPT 聊了聊,都是因为最近 chatGPT 太火了!原创 2022-12-11 10:14:01 · 10074 阅读 · 8 评论 -
chatGPT 又来帮忙了
这主要是程序这种东西,网上开源项目极多,而且规则性较强,连通用数学计算,chatGPT都能学会,更别提程序开发了。之前还和同事开玩笑说,人工智能发展的再厉害,也不可能替代程序员,毕竟程序开发也是个有创造力的工作。对于程序开发者来说,这类人工智能更多的还只是一个工具,毕竟在没有 chatGPT 之前,很多的程序员写的代码,也都是这里抄一抄,那里抄一抄啊。当然,目前人工智能能替代的程序开发也很有限,他能写出来的很多逻辑和案例,在网上基本都能搜得到。既然登录上去了,要不抓紧让它帮我写写代码,就有点说不过去了。原创 2023-04-08 14:44:32 · 3913 阅读 · 0 评论