- 博客(22)
- 收藏
- 关注
原创 RWKV模型介绍
RWKV的全称是"Recurrent Weighted Key-Value",是一种结合了RNN(循环神经网络)和Transformer优点的混合模型。Transformer在自然语言处理任务中表现优异,特别是在捕捉复杂的上下文关系和建模长距离依赖方面,但其自注意力机制在长序列输入下的计算成本极高,导致在资源消耗上存在显著瓶颈。而RNN虽然在处理长序列方面具有较高的计算效率,但其在捕捉复杂的全局依赖性上存在固有局限性,尤其是随着依赖关系的加深,其性能逐渐下降。
2024-10-10 21:45:31
1547
1
原创 Transformer模型简介
Transformer是一种由Vaswani等人在2017年提出的深度学习架构,专门用于自然语言处理(NLP)任务。其引入的注意力机制彻底改变了神经机器翻译、文本生成等众多领域的研究进展,现已成为当今深度学习和NLP的核心工具之一。本文将深入解析Transformer的架构、工作原理及其在各类任务中的优越性。
2024-10-10 21:38:08
961
原创 python获取指定日期之前的最新版本号和该版本的发布日期
最近突然想到,直接安装项目文件最近更新日期及以前的最新Python包,就仿佛模拟作者当时使用的最新包,应该各种包的依赖关系不会出错了。
2024-09-04 23:09:09
405
原创 electerm手动批量添加快速命令 | 快速命令配置文件位置
在网上查找快速命令配置文件位置没找到,猜想软件会把用户添加的快速命令保存在某个配置文件中,直接查找软件使用目录(日志目录所在的目录)下最新更新的文件就应该能找到了。electerm的快速命令能提高效率,但是有批量命令想添加,手动添加还是嫌慢,如果能找到快速命令配置文件位置,直接循环填入就好了。cmds列表中的每行中,第一个元素为1表示"inputOnly":true,否则不添加"inputOnly"属性。第三个元素是name的值,如果不存在,就采用第二个元素。文件中,退出软件重新打开就能看到新的命令了。
2024-08-29 21:21:32
712
原创 ChatGLM3-6B对话流式输出
封装为函数时,history作为外部变量保存历史,出现了报错:UnboundLocalError: cannot access local variable ‘history’ where it is not associated with a value。这是一个命令行运行大模型的例子,是流式输出的,但是用户和ai的历史输出是直接放在字符串中拼接的,我倾向于一个json结构的对话历史。这是官网给的例子,不是流式输出,不过输出历史都是用[{‘role’: ‘user’, ‘content’:…
2024-08-29 00:56:57
304
原创 gradio 运行 JavaScript | chatglm3-6b toggle enter 前端切换换行与提交
js字符串中只有一个函数定义,且并不实际调用,是可行的。按下shift+enter的默认行为不换行(gpt认为会换行,可能与设备有关),在event.shiftKey用了一些较为复杂的textarea.selectionStart之类代码。点击“toggle enter”按钮会切换按键行为,并且具体情况会显示在旁边的文本中,也显示在输入框空白时的placeholder文本中。思路是用js实现按键监听,但是js是在gradio框架中添加的。inputBox.placeholder 的赋值中,空格不能用。
2024-08-28 23:56:21
518
1
原创 云服务器gradio脚本配置nginx
为了能访问在云服务器用gradio部署的大模型,配置一下nginx。还是和上一个博客一样,不注重讲流程,只是记录踩过的坑,和一些细节、完整文件内容。
2024-08-27 22:12:26
1125
原创 大模型chatglm3-6b云服务器部署踩坑记录
在公司的云服务器上部署chatglm3-6b,踩了太多坑,记录一下。主要参考的是 【大模型-第一篇】在阿里云上部署ChatGLM3_使用阿里云服务器部署大模型-CSDN博客。
2024-08-27 00:23:29
1958
2
原创 星火大模型 function calling Python 调用思路
讯飞星火大模型虽说开发文档上写着支持 function calling,但是只给了参数构造示例,没有给Python代码,只给了api调用的代码。:在2024年7月6日,北京的天气预计会非常炎热,同时可能会有冰雹出现。北京昨天的天气状况为多云转雾,温度范围在22℃~31℃,风向风力为南风微风。目前的处理是把函数调用的情况添加到用户的发言中。但是模型经常不考虑调用结果,还是自顾自地回答,输出一堆细节。这里按照接口说明“缝合”了起来,但是星火对返回结果的拼接使用实在是找不到方案,所以这块的处理还有待完善。
2024-07-05 21:43:22
897
1
原创 Python计时函数,使用自定义装饰器
一个Python计时函数,方便查看当前时间、运行总时间、距离上次运行间隔时间。不需要定义全局变量,相关数据都用装饰器存储在函数对象的属性中。
2024-03-06 12:27:26
553
原创 Google Colab运行谷歌硬盘中的ipynb文件
参考:从colab磁盘打开ipynb文件-腾讯云开发者社区-腾讯云 https://cloud.tencent.com/developer/ask/sof/116065808。思路是文件名–>文件标识符–>url地址,直接点击。使用xattr获取文件标识符。
2024-01-22 18:06:59
1301
原创 Mathematica 显示连分数的4种方法
Mathematica 显示连分数的4种方法1.String&Orderless 2.HoldForm 3.Inactivate 4.Defer
2022-02-16 19:43:26
2940
1
原创 JavaScript获取B站分集视频标题及各集时长、累计时长
之前在学习B站分集视频时,为做笔记曾需要频繁复制标题文字,同时也需要知道视频时长,于是用js把标题及时长在控制台输出然后复制存为文本文件。var box=document.getElementsByClassName('list-box')[0];var boxtext=box.innerText;var textline=boxtext.replace(/\n(?!P\d+)/g,' ');console.log(textline);使用方法:按下F12进入开发者工具,点击“Console”标
2022-01-13 17:12:50
4239
7
转载 轨道六根数的含义汇总
卫星百科文章目录卫星百科轨道六根数(0)轨道六根数概述轨道六根数转位置速度矢量位置速度矢量转轨道六根数其他表示(1)半长轴**椭圆****抛物线****双曲线****与速度位置的转化**椭圆双曲线(2)离心率**离心率标量****椭圆****抛物线****双曲线****离心率矢量**(3)轨道倾角(4)近心点辐角计算升交线(5)升交点经度(6)真近点角计算轨道角速度轨道六根数(0)轨道六根数概述在二体问题中,轨道根数(orbital elements)是描述物体运动轨迹的简便形式。三维空间中,唯一
2022-01-12 22:45:52
23979
4
原创 用AHK脚本将Git-Bash中的复制粘贴映射为Ctrl+C/V
用AHK脚本将Git-Bash中的复制粘贴映射为Ctrl+C/V在Git-Bash脚本中的复制粘贴与Windows常见的Ctrl+C/V不同,而是:复制:Ctrl+Insert粘贴:Shift+Insert其中Insert键位于键盘的右上角。但是这样的按键组合可能让人不习惯,我们可以用AHK脚本把它们映射回习惯的Ctrl+C/V。代码如下:;Git-Bish 修改复制粘贴快捷键#IfWinActive ahk_exe mintty.exe$^c::Send,^{Insert}retur
2022-01-01 22:30:09
1002
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人