自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(57)
  • 收藏
  • 关注

原创 git commit后代码丢失如何找回

前端项目为保证代码规范性,会通过husky插件设置了lint-staged,从而对代码在git commit事进行校验。在vscode命令行输入第2条命令,可能会出现下述问题。此时不用怀疑命令出了问题,改用Git Bash终端就可以。如果git commit时遇到代码错误,从而导致代码丢失如何找回?丢失的代码就可以成功找回。

2025-02-26 14:18:41 399

原创 chrome控制台报错就会进入debugger模式怎么取消

我的情况是遇到网络或语法错误机会进入debugger模式,并定位到sources模块,这个时候将下面的Any XHR or fetch取消勾选就好了,可是尝试一下。

2025-02-25 19:59:10 407

原创 cookie、session、token、表单、json、jsonp、websocket、ajax都是什么

通俗地讲就是验证当前用户的身份,证明“你是你自己”(比如:你每天上下班打卡,都需要通过指纹打卡,当你的指纹和系统里录入的指纹相匹配时,就打卡成功)互联网中的认证:用户名密码登录邮箱发送登录链接手机号接收验证码只要你能收到邮箱/验证码,就默认你是账号的主人用户授予第三方应用访问该用户某些资源的权限你在安装手机应用的时候,APP 会询问是否允许授予权限(访问相册、地理位置等权限)你在访问微信小程序时,当登录时,小程序会询问是否允许授予权限(获取昵称、头像、地区、性别等个人信息)

2024-05-13 19:46:40 1218

原创 Vue基础使用之V-Model绑定单选、复选、动态渲染选项的值

【代码】Vue基础使用之V-Model绑定单选、复选、动态渲染选项的值。

2024-04-16 20:18:08 527

原创 Vue基础使用之V-Model绑定表单输入

【代码】Vue基础使用之V-Model绑定表单输入。

2024-04-16 19:48:41 342

原创 Vue基础使用之计算属性Computed和监听属性Watch

【代码】Vue基础使用之计算属性Computed和监听属性Watch。

2024-04-16 16:40:31 453

原创 Vue基础使用之声明式渲染;v-bind;v-if;v-for;v-on;v-model;通过ref获取dom元素的值

【代码】Vue基础使用之声明式渲染;v-bind;v-if;v-for;v-on;v-model;通过ref获取dom元素的值。

2024-04-16 15:35:24 309

原创 进一步观察扩散模型中的参数有效调整

扩散模型由于能够生成高质量和多样化的图像,最近变得流行起来。扩散模型在迭代生成过程中通过与条件信息的交互,在条件生成任务中具有出色的性能,这激发了其在下游任务中的应用,如文本到图像的生成,图像到图像的平移,图像恢复。有了从海量数据中获得的知识,大规模扩散模型在下游任务中表现出了很强的先验能力。其中,DreamBooth在大规模扩散模型中调整所有参数,生成用户想要的特定对象。然而,对整个模型进行微调在计算、内存和存储成本方面效率低下。

2023-09-20 21:43:17 1115

原创 stable diffusion模型讲解

扩散是在下图中粉红色的图像信息创建器组件中发生的过程,过程中包含表征输入文本的token嵌入,和随机的初始图像信息矩阵(也称之为latents),该过程会还需要用到图像解码器来绘制最终图像的信息矩阵。整个运行过程是step by step的,每一步都会增加更多的相关信息。为了更直观地感受整个过程,可以中途查看随机latents矩阵,并观察它是如何转化为视觉噪声的,其中视觉检查(visual inspection)是通过图像解码器进行的。

2023-05-08 16:28:30 7742 1

原创 前端面试题

子组件不能直接修改父组件传递的数据,这样做是维护父子组件之间形成的单向数据流。如果子组件随意更改父组件传递的数据,会导致数据流混乱,提高开发和维护成本Vue-Router是Vue官方的路由管理器。它和Vue.js的核心深度集成,路径和组件的映射关系使得构建SPA(Single Page Application,单页面应用)变得易如反掌router-link - 实质上最终会渲染成a链接router-view - 子级路由显示keep-alive - 包裹组件缓存。

2023-04-05 16:12:55 769

原创 TortoiseGit 使用教程

一、下载工具这里给大家准备了所有安装包自取链接:https://pan.baidu.com/s/1xrxxgyNXNQEGD_RjwKnPMg提取码:qwer也可在官网自行下载最新版1.下载git,直接去官网下载Git - Downloads,根据自己的系统合理下载,然后一路next就可以了。

2023-02-11 11:36:02 1323 2

原创 JAVA

还是需要理解Try...catch...finally与直接throw的区别:try catch是直接处理,处理完成之后程序继续往下执行,throw则是将异常抛给它的上一级处理,程序便不往下执行了。本题的catch语句块里面,打印完1之后,又抛出了一个RuntimeException,程序并没有处理它,而是直接抛出,因此执行完finally语句块之后,程序终止了。其中:类中静态块按照声明顺序执行,并且(1)和(2)不需要调用new类实例的时候就执行了(意思就是在类加载到方法区的时候执行的)

2023-02-02 21:07:56 221

原创 数组

插入和删除操作,我不晓得高不高效,因为可能会出现存储上的冲突,此时就要执行冲突规避的方法。另外,顺序访问肯定也是比较复杂的,链表和数组直接无脑地下一位即可,但是哈希表得计算哈希值再由哈希值访问到相应的内存位置。:最大优势就是插入、删除十分方便,我们可以在链表的任何位置通过修改指针的指向,从而向链表当中插入新的结点。:它的存储可以是连续或者离散的,我们得从队列的性质出发,它最大的特点就是只支持队尾插入和队头删除,这种操作模式比较死板,而链表则可以在任何位置进行插入及删除操作。9.float类型占用4个字节。

2023-02-02 20:31:26 1440

原创 论文翻译:Text-based Image Editing for Food Images with CLIP

最近,大规模的语言-图像预训练模型,如CLIP,由于其对各种任务,包括分类和图像合成的显著能力而引起了广泛的关注。CLIP和GAN的组合可用于基于文本的图像处理和基于文本的图像合成。迄今为止,已经提出了几个CLIP和GAN的组合模型。然而,它们在食品图像领域的有效性还没有得到全面的研究。在本文中,我们报告了使用VQGANCLIP进行基于文本的食品图像处理的实验结果,并讨论了通过文本进行食品图像处理的可能性。随着智能手机和社交媒体的发展,人们在互联网上发布了各种照片。其中,最常张贴的照片之一是吃饭。

2023-02-02 16:14:03 1064 1

原创 如何写好一篇科研论文

详细介绍了如何写一篇科研论文的思路和步骤

2023-02-01 14:50:05 245

原创 如何批量提取不同文件夹下的图片并随机重命名

无论是在为了跑深度学习模型而准备数据集,还是其他的一些用途,相信大家都会遇到一个问题:我所需要的图片分布在很多不同的文件夹下,但我不需要这么多文件夹,那么我如果要使用这些图片的话,就需要把这些文件夹下的图片一个个提取出来,然后再放到新建的文件夹下,有时如果文件夹下的图片是按照顺序命名的,比如001.jpg......089.jpg等等,那么将他们放到一个文件夹下还面临文件名重复需要重命名的问题。(比如我需要将deepfashion2数据集的图片提取一部分放到我的文件夹下,就面临以上问题)

2022-12-18 20:33:27 7684 2

原创 Tmux使用教程

Tmux 是一款可以管理会话和分屏的终端复用器。在远程 SSH 断开后可以继续执行任务,重新连接后再继续会话。也能够将进程放到后台运行,需要时重新接管。为了防止 SSH 因网络断开造成的进程运行中断,推荐把所有需要长期运行的训练等任务都使用 Tmux 终端。

2022-11-03 15:29:27 2193 2

原创 [深度学习] 名词解释--正则化

花书的定义:凡是可以减少泛化误差(过拟合)而不是减少训练误差的方法,都叫正则化方法。目的:拟合训练数据,防止模型过拟合,通常使用L2正则化.用各种方法规范模型参数的方法.

2022-10-26 19:33:27 2823 4

原创 【GAN】基础原理讲解及代码实践

生成式对抗网络(GAN )是一种深度学习模型,是近年来复杂分布上无监督学习最具前景的方法之一。模型通过框架中(至少)两个模块:生成模型(Generative Model)和判别模型(Discriminative Model)的互相博弈学习产生相当好的输出。

2022-10-26 17:15:39 4366 1

原创 解决:RuntimeError: CUDA out of memory. Tried to allocate 160.00 MiB (GPU 0; 10.76 GiB total capacity..

内存分配不足:需要160MB,,但GPU只剩下135.31MB,

2022-10-25 10:52:00 21491 7

原创 【深度学习】数据集打标签:生成train.txt和val.txt

当我们在Github上下载一篇论文的代码后,我们如何在自己的数据集上进行复现呢?这是在百度爬的十分类的服装数据集,其中train文件夹下每类大概300张,val文件夹下每类大概100张,总共在4000张左右。

2022-10-25 10:38:48 10398 1

原创 【GitHub】VQGAN+CLIP代码从零开始复现

从开放领域的文本提示中生成和编辑图像是一项具有挑战性的任务,到目前为止,需要昂贵的和经过专门训练的模型。我们为这两项任务展示了一种新的方法,它能够通过使用多模态编码器来指导图像的生成,从具有显著语义复杂性的文本提示中产生高视觉质量的图像,而无需任何训练。我们在各种任务上证明了使用CLIP来指导VQGAN产生的视觉质量比之前不太灵活的方法如minDALL-E、GLIDE和Open-Edit更高。

2022-10-20 15:51:47 2905

原创 chrome使用百度搜索被重定向带tn=~~~_hao_pg尾巴去除方法

最近上网,发现自己的百度搜索每次搜索之后都自动跳到www.baidu.com/?tn=~~~~_hao_pg 这样带有尾巴的搜索页 ,感觉非常恼怒,这些人为了推广自己的主页,不择手段。

2022-10-18 10:51:26 7413 2

原创 如何删除pytorch虚拟环境

这一步有个坑,复制粘贴的命令行会报错:-bash: conda env: command not found。手敲一遍运行就没问题。3.输入conda env list发现vqgan环境已被删除。2.我要删除的虚拟环境名是vqgan ,你换成你的名称就行。

2022-10-16 09:30:14 11302 1

原创 Linux下如何通过镜像快速下载pytorch

首先要默认你在服务器已经安装好了anaconda或者miniconda。添加镜像之后,直接利用中科大源进行pip下载(好像默认是最新版本?

2022-10-15 17:29:58 1952 1

原创 IDEA运行报错 Error:Failed to load project configuration: cannot parse file前言中不允许有内容。

报错信息:Error:Failed to load project configuration: cannot parse file D:\123\cloud2021\.idea\workspace.xml: ParseError at [row,col]:[1,1] Message: 前言中不允许有内容。可能引起的原因是上次IDEA在运行过程中被异常关闭,导致了当前的工作空间发生了紊乱。应该要先关闭项目,然后在项目文件夹中删除.idea文件,然后再重写导入。3.重新打开IDEA,导入项目,运行程序。

2022-10-10 20:59:10 6978

原创 IDEA如何复制模块

比如复制模块cloud-provider-payment8001为cloud-provider-payment8002,即只更改端口号,其他代码不动,在IDEA中如何操作?

2022-10-10 15:31:26 3110

原创 解决urllib.error.URLError: <urlopen error [Errno 104] Connection reset by peer>

在使用URL下载或跑模型的时候,报错urllib.error.URLError: URL访问问题,可能是是浏览器的问题,也可能是是URL。1.关闭VPN,报错消失。

2022-09-27 19:40:32 5367

原创 linux下如何运行.sh脚本

以hello.sh文件为例,sh hello.sh即可执行hello.sh文件。比如以hello.sh文件为例,终端执行以下命令,即可执行hello.sh文件。用“./”加文件名.sh执行时,必须给.sh文件加x执行权限。【步骤二】给.sh文件添加x执行权限。【步骤二(2)】sh 执行.sh文件。【步骤一】cd到.sh文件所在目录。方法一:当前目录执行.sh文件。方法二:绝对路径执行.sh文件。【步骤三】./执行.sh文件。

2022-09-27 19:29:19 28127

原创 论文笔记:VQGAN-CLIP:Open Domain Image Generationand Editing with Natural Language Guidance

在这项工作中,我们首次提出了语义图像生成和编辑的统一方法,利用预先训练的图像-文本联合编码器(本文指clip)来引导图像生成模型。我们的方法是通过使用多模态编码器来定义一个损失函数,评估(文本,图像)对的相似性,并反向传播到图像生成器的潜在空间。

2022-09-27 10:31:26 2176 1

原创 解决pip._vendor.urllib3.exceptions.ReadTimeoutError: HTTPSConnectionPool

解决问题解决问题使用命令安装。

2022-09-24 17:18:39 39443 14

原创 什么是zero-shot, one-shot和few-shot Learning

利用训练集数据训练模型,使得模型能够对测试集的对象进行分类,但是训练集类别和测试集类别之间没有交集;期间需要借助类别的描述,来建立训练集和测试集之间的联系,从而使得模型有效。Zero-shot learning 就是希望我们的模型能够对其从没见过的类别进行分类,让机器具有推理能力,实现真正的智能。其中零次(Zero-shot)是指对于要分类的类别对象,一次也不学习。

2022-09-23 11:12:24 34016

原创 DALL·E 2 解读 | 结合预训练CLIP和扩散模型实现文本-图像生成

DALL·E 2 这个模型的任务很简单:输入文本text,生成与文本高度对应的图片。它主要包括三个部分:CLIP,先验模块prior和img decoder。其中CLIP又包含text encoder和img encoder。(在看DALL·E 2之前强烈建议先搞懂CLIP模型的训练和运作机制)

2022-09-22 15:48:12 2769

原创 通俗理解DDPM:生成扩散模型

本文将逐渐介绍近两年关于生成扩散模型的一些进展。据说生成扩散模型以数学复杂闻名,似乎比VAE、GAN要难理解得多,是否真的如此?扩散模型真的做不到一个“大白话”的理解?让我们拭目以待。

2022-09-21 11:09:40 7198 1

原创 论文笔记:DALL-E2:Hierarchical Text-ConditionalImage Generation with CLIP Latents详解

对这张图的一点理解:首先虚线上面是一个clip,这个clip是提前训练好的,在dalle2的训练期间不会再去训练clip,是个权重锁死的,在dalle2的训练时,输入也是一对数据,一个文本对及其对应的图像,首先输入一个文本,经过clip的文本编码模块(bert,clip对图像使用vit,对text使用bert进行编码,clip是基本的对比学习,两个模态的编码很重要,模态编码之后直接余弦求相似度了),再输入一个图像,经过clip的图像编码模块,产生了图像的vector,这个图像vector其实是gt。

2022-09-20 17:40:11 6364

原创 linux常用命令行

文件操作【增,删,改,查】

2022-09-16 14:51:34 388

原创 基于Vagrant和virtual Box搭建linux虚拟机

vagrant是一款方便的虚拟机管理软件,可以配合多个不同虚拟机软件一起使用。其中因vitualbox是开源软件,所以常见使用的组合是vagrant+vitualbox的方式来管理虚拟机。简单理解,就是可以通过Vagrant这个工具管理虚拟机,比如说想创建一个centos环境的虚拟机,不需要安装系统这么麻烦,通过vagrant可以快速创建。

2022-09-16 09:52:30 689

原创 阿里云服务器白嫖一个月并安装linux及宝塔,redis教程

之后我们通过Xshell连接这个远程服务器,主机端口就是你开的服务器的共有ip地址,密码就是上面修改过后的密码,用户名是root,端口号默认22。按照下图指示选择(其中预装应用Lamp可选可不选,后期可以在宝塔面板自定义安装)之后重置实例密码(后续Xshell连接会用到),重启生效。之后点击用户身份验证,输入用户名,密码,连接成功。在浏览器输入外网地址,在弹框中输入用户名和密码。进入阿里云官网,打开搜索输入云服务器ECS。创建之后在控制台的我的实例查看。之后点击安全组,选择配置规则。

2022-09-15 11:31:34 2058

原创 cifar-10数据集的下载及恢复原图片

data_batch_1~data_batch_5是训练集数据,每个文件里有10000张图片,test_batch是测试集数据,也含有10000张图片。之后会得到不同标签的文件夹。选择python版本。

2022-09-13 10:06:17 3418

原创 论文笔记:coOP:Learning to Prompt for Vision-Language Models详解

coOP是一个专门用于调整CLIP-like视觉语言模型的简单方法,用于下游图像识别。具体来说,CoOp用可学习的向量对提示的上下文词进行建模,而整个预训练的参数则保持固定。为了处理不同的图像识别任务,我们提供了两个可实现的CoOp:统一语境和特定类别的语境。

2022-09-11 16:25:20 9065 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除