- 博客(9)
- 收藏
- 关注
原创 对SFT与RLHF两种训练方式的一些个人理解与问题
模型SFT训练过程中模型输出错误结果,与answer计算得到的Loss值较大,通过反向传播降低模型输出错误结果的概率以降低Loss,是否是一种学习到了负反馈?如果只使用chosen answer来进行SFT是否可以替代RLHF?如果通过修改Prompt的方式将rejected answer数据也加入到训练中,是否可以用SFT替代RLHF?如果在SFT过程中添加rejected answer相关的loss是否可以替代RLHF?
2025-03-10 15:27:38
361
原创 VisionLLM v2详解
VisionLLM v2提出了一种新的信息传输机制,称为“super link”,能够作为媒介将 MLLM 与特定下游任务decoder连接起来,使VisionLLM v2获得了端到端的多个不同下游任务的处理能力。Super Link不仅能够对MLLM和多个下游任务解码器之间的任务信息和梯度反馈进行灵活的传输,而且有效地解决了同一个模型的多任务场景下的训练冲突。
2024-07-08 23:29:27
1706
原创 多模态大模型训练数据与资源总结
总结对比QWenVL、Vary、InternVL-V-1.5三个多模态大模型的预训练阶段与Finetune阶段对于数据量与训练资源的需求。目标是借此了解多模态大模型在训练过程中需要的数据类型数据量级以及训练资源。
2024-06-28 17:36:11
1436
1
原创 CUDA、Conda、PyTorch三者联系
pytorch在运行时,系统安装的cuda与conda环境下安装的cudatoolkit之间的联系与不同
2022-11-20 20:34:28
3435
原创 VTK9.1.0在Windows10+VS2019+Qt 5.15.2环境下编译安装以及VTK应用于QT
下载VTK安装包在VTK官网 Download | VTK 中下载VTK9.1.0待编译源码,解压后在路径Documentation/dev/bulid.md中可以看到官方提供的Prerequisites以及简易教程编译环境安装按照官方提供的Prerequisites,安装以下环境:CMakeVersion 3.12 or newer, however, the latest version is always recommendedQt 5.15.2Visual Studio..
2021-10-14 23:09:32
16218
18
原创 VSCode与PyCharm提示unresolved import解决方案
问题描述在VScode或者pyharm中采用python import自定义模块是,有时会显示unresolved import警告并且 无法跳转到自定义模块函数定义出现问题的原因没有安装import对应的模块import的文件夹没有添加__init__.py文件项目的PYTHONPATH没有设置正确解决方案原因1,使用pip安装好对应的模块即可原因2,在需要import的文件夹下新建__init__.py文件原因3,这里对VSCode与Pycharm分别进行解决VSCode与
2020-11-30 19:42:32
2198
1
原创 127.单词接龙
127.单词接龙难度:中等标签:双向BFS题目描述给定两个单词(beginWord 和 endWord)和一个字典,找到从 beginWord 到 endWord 的最短转换序列的长度。转换需遵循如下规则:每次转换只能改变一个字母。转换过程中的中间单词必须是字典中的单词。说明:如果不存在这样的转换序列,返回 0。所有单词具有相同的长度。所有单词只由小写字母组成。字典中不存在重复的单词。你可以假设 beginWord 和 endWord 是非空的,且二者不相同。示例 1:
2020-11-14 16:03:55
274
原创 572.另一个树的子树
目录572.另一个树的子树题目描述题解代码实现572.另一个树的子树难度:中等标签:递归题目描述给定两个非空二叉树 s 和 t,检验 s 中是否包含和 t 具有相同结构和节点值的子树。s 的一个子树包括 s 的一个节点和这个节点的所有子孙。s 也可以看做它自身的一棵子树。题解一个树是另一个树的子树 则:要么这两个树相等要么这个树是另一个树的左子树的子树要么这个树是另一个树的右子树的子树代码实现# Definition for a binary tree node.# cla
2020-11-13 12:03:43
114
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人