- 博客(30)
- 收藏
- 关注
原创 [2024CVPR] Alpha-CLIP论文
上海交通大学, 复旦大学, 香港中文大学, 上海人工智能实验室, 澳门大学, MThreads, Inc.github地址:https://aleafy.github.io/alpha-clipCLIP模型因其强大的图像-文本对齐能力而被广泛应用,但其局限性在于对图像中目标的区域级别关注不足。传统方法多通过裁剪、后处理(如ROI Pooling)提取区域特征,容易丢失上下文信息或导致特征不够精细。通过引入Alpha通道,增强了CLIP在区域级别任务中的表现。
2025-01-15 16:58:32
777
原创 似然函数,最大似然函数理解
很早以前就学过这个概念,但是一直对这个定义抱有疑问:为什似然函数是用乘积的方式进行构建?在似然函数的定义中说似然函数是联合概率密度函数,联合概率密度函数就是要区分连续型和非连续型,为什么用联合概率密度函数定义似然函数,又给了他超越定义(连续或者离散)的统一形式呢(乘积)?
2025-01-12 19:49:58
671
原创 RCNN, Fast R-CNN 与 Faster RCNN理解思路和对比
后来,出现了Fast RCNN的方法,可以看到Fast RCNN 还是没有放弃2k个区域提议的部分,这是主要导致时间长的问题。
2024-11-15 20:22:16
1183
原创 Git-to-Github使用及相关问题
git commit -m 'xxx' (添加文件的信息,方便查看本次添加的内容是什么)如果本地仓库文件和github上面仓库文件不同(指少了或者多了文件,已有的文件需要相同)git branch -M main (设置分支,下面的main就是分支名称)git add . (添加全部) git add 文件名称(单个文件)可以先把github上面的文件先拉一下,再上传。(推送到上面仓库地址的main分支)(注意,分支名称需要保持相同)(设置本次推送的仓库地址)
2024-11-03 22:22:55
201
原创 论文解读2:Deformable DETR论文阅读和源码分析
Deformable DETR主要解决了不能输入多个骨干网络提取的特征图的问题,它是通过修改transformer的attention的结构实现的,它的这个结构使得训练轮次缩小10倍以上,原始的DETR的训练轮次需要500个才能达到和Faster-RCNN类似的效果。同时在小目标的检测结果更好。为什么?应该是因为文章提出的可变形注意力机制的结构,它利用了可变形卷积的类似结构,可以学习到稀疏的有意义的位置。
2024-07-30 15:18:02
989
原创 论文解读1:DETR论文阅读和源码分析
DETR是目标检测领域除了yolo之外的另一种体系和框架(也就是开启了新的一种目标检测范式),自2020年发表以后,目前已经有12000+的引用量了。最开始的DETR是一个简单并且高效的框架,训练轮次较少的情况下就可以取得不错的效果,在大目标上的效果比较好,小目标的效果稍差。transformer结构的使用二分图匹配算法对于这两点的解释:(如果不明白可以先跳过,看完论文再看)transformer是对特征图的提取,encoder阶段是,decoder阶段是。
2024-07-17 15:37:43
1689
1
原创 AffectNet数据集下载剪裁清洗
valence和arousal是心理学里面的术语,valence是衡量情感价值或者情感的愉悦度,正面情感具有高 valence,而负面情感具有低 valence。arousal是情感的激活或唤醒水平,Arousal 可以是高或低,高唤醒水平可能与兴奋、紧张或愤怒等情感状态相关,而低唤醒水平可能与放松、平静或无聊等状态相关。3.标注的内容和数据都放在csv表格里面,表头分别是:图片的相对路径,图像中表情人脸的坐标,facial_landmark(人脸标注点),表情类型,2)图片位置标注为NULL。
2024-07-12 15:57:55
1840
3
原创 yolo模型进行目标检测+单追踪模型整合(亲测有效)
使用yolov8模型和pysot的siamRPN相结合,yolo模型对第一帧模型进行目标检测,鼠标确认后续追踪的模型,之后pysot模型针对该目标进行目标检测。分析:根据pysot模型的解析和官方提供的结构,上述内容的实现只需要在tools/demo.py文件进行修改即可。
2024-07-02 17:20:59
1003
原创 yolov8+yolov10根据自己的数据集进行训练预测
目录是:ultralytics/models/yolo/detect/predict.py。
2024-06-27 14:32:49
604
转载 如何利用另外一台电脑(windows)作为服务器连接并使用
首先是这个链接中的方法打开windows的SSH服务功能。ssh 名称@IP地址(名称和地址参考第二个链接)如果没有安装这个服务,可以参考这个更佳详细的链接。最后使用另外一台电脑连接这台“服务器”
2024-06-25 17:35:31
419
1
原创 基于pycharm和putty下载安装pytorch和miniconda并连接服务器进行使用
注意:创建了虚拟环境需要先激活虚拟环境再安装。1.在已有管理员账号密码的情况下,首先用putty(第三方软件)连接服务器。注意:不能直接打开服务器上的文件进行运行,需要将py文件下载下来才能运行。3.使用自己的账号密码用putty连接服务器并配置环境。2.按照linux环境下的命令创建新的用户并设置密码。7.需要用pip安装包,可以直接在pycharm中进行。在官网上选择对应版本并下载安装。6.在pycharm中使用服务器。5.安装pytorch环境。
2023-12-27 15:50:28
617
1
原创 ImportError: DLL load failed while importing _path: 找不到指定的模块 matplotlib
这个路径就是报错:ImportError: DLL load failed while importing _path: 找不到指定的模块 matplotlib。前面提示的在C盘的那个路径。但是,由于之前下载安装的时候cmd中可能有一次忘记切换盘了,但是也成功activate pytorch虚拟环境,因此,在C盘中它也存在之前下载过不合适的matplotlib。首先,我是在D盘中存储anaconda的文件,新创建的虚拟环境(pytorch)也在D盘。尝试了各种方法,下面链接中的方法我都尝试过了。
2023-12-19 11:37:58
814
1
原创 数据结构——链表(python)
链表的相关题目需要分为笔试和面试准备。*笔记的话可以不用考虑额外的空间复杂度,但是面试的话需要需要提升自己就利用原有的数据的情况下进行题目的解答的过程。
2023-08-03 21:04:34
987
原创 Yolov5+deepsort(人脸识别)+权重+问题总结
注意:文中的代码没有yolov5的模型文件,随便在github上找一个yolov5模型的源码,把utils和models文件下载放进去就可以了。(这里面放的是yolo模型的一些基本的文件)该教程使用的官方的文件,运行的时候会直接下载,不过权重大小好像不匹配,我后面放了解决方法。然后创建一个weight文件目录,这里面就放自己训练的需要检查目标的权重文件。
2023-07-01 23:39:22
977
原创 排序算法——选择排序和冒泡排序
1.0~N-1开始,从0位开始两两比较,小的放前面,大的放后面。1. 在0~N-1个位置中不断循环找到最小的数放在0位。2. 在1~N-1的位置找到最小的数放在1位。时间复杂度O(N^2)
2023-07-01 00:15:24
103
原创 排序算法——桶排序
这是最后一个学习的排序算法,之前的排序算法都是基于比较的思路形成的,而该排序算法是数据的状况来确定的。(不是基于比较的)时间复杂度为O(N),额外空间复杂度为O(M)。
2023-06-30 11:56:39
122
原创 排序算法——堆排序
首先利用heapinsert函数组织大根堆,得到这样一个序列之后,数组位置为0的数就是大根堆的最大值,因此我们把这个值”弹出“(这个操作指的是,将数组中第一个和最后一个位置的数值交换,同时heapsize--。由于输入的序列是一个数组,每个数都有自己的下标,因此我们可以通过该下标找到该数的父节点( (i-1)/2 )和子节点(左:2i+1;然后从0位置开始做heapify,也就是重新给这个数找位置,heapify结束后,新的根的位置同样是剩下序列的最大值,因此我们把这个值”弹出“。
2023-06-28 16:16:06
128
1
原创 排序算法——快速排序+荷兰国旗问题(颜色分类)
因此,将大于区域的第一个数值与目前的num交换,然后num自然属于这两个区域中间的位置。给定一个包含红色、白色和蓝色、共 n 个元素的数组 nums ,原地对它们进行排序,使得相同颜色的元素相邻,并按照红色、白色、蓝色顺序排列。同理,如果变式题目要求小于某数的数值放在左边,等于放在中间,大于该数的放在右边,就需要把临界值的0、2,改为>、<某值的条件。最终的快速排序算法就是按照定义基准数,不断比较大小,划分大区域、小区域,最后在这两个区域上使用的。让p1和p2指向小区域的最右边和大区域的最左边。
2023-06-25 21:20:40
142
原创 如何理解python中字符串不可变?
而在该例子中,修改是被允许的,因为没有对字符串本身进行修改,而是改变了指向字符串变量的标签。该例子中s是一个字符串,对字符串内容的修改是不允许的。最近看到一个例子,说明了字符喜欢不可以变的情况。
2023-06-20 09:58:54
583
原创 Tensorflow学习——tf.Variable和Keras两种方法定义网络结构
总结一下,第一种方法使用 TensorFlow 的低级API,需要手动定义网络结构和参数,更加灵活;第二种方法使用 TensorFlow 的高级API(Keras),通过组合层和模型组件来定义网络结构,更加简洁和易用。
2023-06-15 17:21:44
296
1
原创 Linux基础(1)文件目录命令
权限(rwx)+ 硬连接数目 +主用户权限 +其他人权限+.(代表安全机制)mv 修改目录名称 mv dir1 dir11 (把dir1改为 dir11)mkdir只能按照层级创建,想直接创建就使用参数-p。l/d( d表示目录 l表示链接 -普通文件)cat 查看文件属性 more 也可以查看。ll 看该目录下所有文件的格式输出信息。或者 单独对某个文件查看信息。ls -l 以这种格式显示。pwd 查看在哪个目录下面。ls -d 查看详细信息。rm -rf 很强 慎用。rmdir 删除空目录。
2023-02-28 12:36:26
151
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人