自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(46)
  • 资源 (1)
  • 收藏
  • 关注

原创 anaconda环境和包安装问题

anaconda环境问题查看环境信息: conda info -e创建一个新环境:conda create --name 环境名创建环境并添加包:conda create --name 环境名 包名删除环境:conda env remove --name 环境名切换环境:conda activate 环境名...

2020-05-09 19:18:53 1010

原创 GR00T N1: An Open Foundation Model for Generalist Humanoid Robots

开发能够与世界无缝互动并执行广泛任务的机器人一直是机器人技术和人工智能领域的长期目标。近期,在海量数据集上训练的基础模型凭借其卓越的泛化能力,已经在自然语言处理和计算机视觉等领域掀起革命。然而,将这一范式应用到机器人领域面临独特的挑战,主要是由于"数据孤岛"问题——机器人数据在不同实体、控制模式和传感器配置之间的碎片化。图1:GR00T N1采用的数据金字塔方法,根据规模和实体特异性组织异构数据源。

2025-04-16 10:18:55 645

原创 Seaweed-7B: Cost-Effective Training of Video Generation Foundation Model

该模型可以执行各种任务,包括文本到视频生成、图像到视频生成和视频操作,使其具有高度的通用性,尽管与Sora等更大的模型相比,它的尺寸相对紧凑。近年来,视频生成模型取得了巨大的进步,但大多数最先进的方法依赖于大量的计算资源,这对于许多研究人员和组织来说是无法企及的。Seaweed-7B 代表了经济高效的视频生成技术的重大进步,证明了经过精心优化的中型模型可以实现与在大量资源上训练的更大的模型相媲美的结果。VAE 组件实现了最先进的重建质量,从而有助于生成的视频中的高真实感和生动的运动。

2025-04-16 09:56:17 601

原创 Test-Time Scaling in Large Language Models: A Comprehensive Survey

大型语言模型(LLM)传统上通过预训练缩放进行改进,包括增加模型参数、训练数据和计算资源。然而,目前正在向测试时缩放(TTS)发生重大转变——在推理期间分配额外的计算资源,以最大化模型性能,而无需更改模型参数。Qiyuan Zhang 等人撰写的论文“What, How, Where, and How Well?A Survey on Test-Time Scaling in Large Language Models”提供了第一个全面的框架,用于理解和组织 LLM 测试时缩放方法快速发展的格局。

2025-04-16 09:26:14 1016

原创 InternVL3: Exploring Advanced Training and Test-Time Recipes for Open-Source Multimodal Models

多模态大型语言模型 (MLLM) 已经成为强大的 AI 系统,能够理解和生成跨不同模态的内容,尤其是视觉和语言。虽然像 GPT-4o、Claude 3.5 Sonnet 和 Gemini 2.5 Pro 这样的闭源模型已经展示了卓越的能力,但开源替代方案的性能往往滞后。InternVL3 在开源 MLLM 的开发方式上引入了一个重大的范式转变。

2025-04-16 09:07:39 977

原创 GPT-4o Image Generation Capabilities: An Empirical Study

近年来,图像生成领域发生了巨大的变化,从生成对抗网络 (GAN) 发展到扩散模型,再到可以处理多种模态的统一生成架构。GPT-4o 作为一种原生多模态模型,能够直接从文本提示生成图像或转换现有图像,代表了该领域的重大进步。本概述考察了一项全面的实证研究,该研究评估了 GPT-4o 在多个任务中的图像生成能力,并将其与领先的商业和开源替代方案进行基准测试。通过了解这种闭源系统的优势和局限性,研究人员和从业者可以深入了解当前统一生成模型的现状,并为未来的发展方向指明方向。

2025-04-15 17:17:29 760

原创 Hogwild! Inference: Parallel LLM Generation via Concurrent Attention

大型语言模型(LLM)彻底改变了自然语言处理,但它们的顺序特性在文本生成过程中造成了计算瓶颈。每个 token 预测都需要模型处理所有先前的 token,导致推理时间随输出长度线性增长。对于需要生成冗长输出的复杂推理任务来说,这种限制尤其成问题。在 Yandex、HSE University 和 IST Austria 的研究人员开发的一种新方法中,多个 LLM 实例并行工作以协作解决问题,并通过共享内存缓存实时访问彼此的输出。这种名为 "Hogwild!推理 "的方法,其灵感来源于 Hogwild!

2025-04-15 16:41:27 875

原创 RK3588 Coremark 性能测试

测试结果:单核性能17380,八核性能85751。

2025-03-06 14:11:07 275

原创 cursor中使用ollama模型

cursor官方并不原生支持本地LLM部署,需要通过openai_api_key来实现。

2025-02-18 16:08:07 3348 1

原创 volatile 关键字作用与用法

volatile关键字用于告诉编译器:该变量的值可能会在程序之外发生变化,因此编译器不能对其进行优化。它常用于硬件寄存器、内存映射 I/O、中断标志、共享的多线程变量等场景。使用volatile可以防止编译器缓存变量值,但它不提供线程间同步或原子性保证,需要配合其他同步机制使用。

2024-12-03 15:10:42 929 1

原创 C内联汇编

C语言的内联汇编提供了灵活的方式来嵌入底层操作,允许程序员直接访问CPU寄存器、执行低级指令或进行特殊优化。它是一个非常强大的工具,但也需要谨慎使用,特别是在跨平台开发和代码维护时。

2024-12-03 15:09:27 1011

原创 机器指令与指令集异同

机器指令是指令集中的具体指令,代表了处理器可以直接执行的低级操作,通常是二进制编码。指令集是一个完整的指令集合,定义了处理器可以执行的所有操作。因此,机器指令和指令集是不同的概念,但机器指令是指令集的具体实现形式。

2024-12-03 15:08:19 575

原创 超标量与超线程技术

超标量技术更多关注在单个核心内部通过并行执行多个指令来提高计算效率。超线程技术则是通过增加逻辑处理器的数量,在多线程工作负载下提升处理器资源的利用率。这两项技术通常可以结合使用,以进一步提升处理器的性能。

2024-12-03 15:04:47 1020

原创 指令调度与寄存器分配

指令调度主要关注在指令执行时序上的优化,目的是通过并行执行和减少等待时间提升程序执行效率。寄存器分配则关注如何高效地将变量和临时值分配到有限的寄存器中,以减少内存访问并提高执行速度。这两项技术在编译优化中是紧密结合的,互相协调共同作用,以实现更高效的代码执行和更低的执行开销。

2024-12-03 15:00:50 1076

原创 SIMD与SIMT

SIMD适用于数据级并行性较高的任务,在执行相同操作时可以显著提高性能,特别是在处理向量数据时。SIMT适用于线程级并行性的任务,尤其是在GPU计算中,适合处理独立线程的计算,每个线程可以有独立的数据和执行路径。两者的主要区别在于执行的并行单位:SIMD侧重于在一个指令下并行处理多个数据元素,而SIMT侧重于在多个线程下执行相同的指令,处理不同的数据。SIMT常见于GPU计算,SIMD则多用于CPU架构的并行化计算。

2024-12-03 14:58:43 935

原创 基于RK3588实现图像实时采集、处理、显示

实现视频实时采集、深度学习目标检测、实时检测视频效果显示功能,基于RK3588实现。

2024-09-02 10:11:56 1666 5

原创 UnixBench分数计算与多进程测试

在支持较好的测试机上直接运行RUN脚本即可得到测试结果。

2024-08-08 17:00:12 448 1

转载 神经网络加速器设计参考

【VeriMake】在安路FPGA开发板上移植ARM Cortex-M0内核(开头讲了一个简单的案例)【VeriMake】在安路FPGA开发板上移植ARM Cortex-M0内核(上)(比较详细)【VeriMake】在安路FPGA开发板上移植ARM Cortex-M0内核(下)(比较详细)【CSDN】基于FPGA的深度卷积神经网络的加速器设计(论文译文)(个人感觉非常好)★。【正点原子】开拓者FPGA开发板视频教程-(Nios II篇)(F盘)《计算机组成与设计:硬件/软件接口(原书第5版 ARM版)》

2024-03-18 20:28:48 206

原创 异构计算/高性能计算算子库与软件栈

清华大学翟季冬 http://pacman.cs.tsinghua.edu.cn/~zjd/

2024-01-25 14:40:18 595

原创 算子开发参考

神经网络框架自定义算子。NVIDIA 计算库。

2024-01-20 20:45:21 624

原创 windows usbip(瑞芯微windows开发)

除usbipd之外,还有一个usbip仓库可以参考。检查 vhci_hcd 模块: 确保。wsl2中运行,可发现设备。windows上运行。

2023-11-16 11:02:54 990

原创 终端复用工具tmux基础使用教程

tmux是一种比screen更加强大的终端复用工具。

2022-09-24 18:36:05 564

原创 wsl环境下docker报错:Cannot connect to the Docker daemon

wsl环境下docker报错:Cannot connect to the Docker daemon

2022-09-19 20:56:27 1336 1

原创 Pyinstaller 打包踩坑指南

创建一个新的环境用于打包,这样不会导致打包exe太大遇到的问题及正确解决方案:1、[WinError 6] 句柄无效Traceback (most recent call last): ... File "subprocess.py", line 383, in run File "subprocess.py", line 640, in __init__ File "subprocess.py", line 850, in _get_handlesOSError: [WinErro

2021-11-13 21:58:04 2397 1

原创 PyTorch Image Models(timm)库基础

timm是由Ross Wightman创建的深度学习库,是一个关于SOTA的计算机视觉模型、层、实用工具、optimizers, schedulers, data-loaders, augmentations,可以复现ImageNet训练结果的训练/验证代码。代码网址:https://github.com/rwightman/pytorch-image-models简略文档:https://rwightman.github.io/pytorch-image-models/详细文档:https://fa

2021-09-07 16:12:59 8274 1

原创 VScode远程连接失败

原文链接:https://stackoverflow.com/questions/56671520/how-can-i-install-vscode-server-in-linux-offline/57601121#57601121commit_id=f06011ac164ae4dc8e753a3fe7f9549844d15e35# Download url is: https://update.code.visualstudio.com/commit:${commit_id}/server-linu

2021-07-25 16:49:24 382 1

原创 庖丁解牛-特征归一化/标准化

为什么要对特征做归一化/标准化?统一量纲,对于距离敏感性模型能够提升精度(如K-means、KNN、PCA、SVM),对基于梯度下降的模型能加快收敛(如线性回归、逻辑回归、神经网络)。为什么对于基于距离的模型能够提升精度?不同的特征的数量级不同,如果不使用标准化/归一化,原始数量级大的特征可能会对模型输出造成较大影响,而数量级小的特征可能对于模型输出影响较小。也即模型要学习到:在特征同等重要的情况下,对数量级大的特征分配一个小的权重,对数量级小的特征分配一个大的权重。归一化之后可以优化这一过程,降低了

2021-06-21 22:19:23 207

原创 Python进阶

为什么要使用装饰器?目的?假设我们要增强一个函数A的功能,但又不希望修改函数A的定义,这种在代码运行期间动态增加功能的方式,称之为“装饰器”(Decorator)。说白了,就是通过新写一个函数B将原函数A包装进去,并添加一些新的代码增加额外的功能。如何实现?实现基础原理:由于函数也是一个对象,而且函数对象可以被赋值给变量,所以,通过变量也能调用该函数。例:设计一个decorator,它可作用于任何函数上,并打印该函数的执行时间:import functoolsdef metric(fn):

2021-06-19 17:49:56 136

原创 终端复用工具screen

screen是一款非常简单易上手的终端复用工具,可以将会话与窗口分离,避免断线导致服务器程序断掉。如需要更强大的功能,可参考。Ctrl + a,c #在当前screen会话中创建一个子会话。Ctrl + a,0-9 #在第0窗口至第9子会话间切换。,tmux是一种功能更加强大的终端复用工具。Ctrl + a,d #暂离当前会话。Ctrl + a,p #上一个子会话。Ctrl + a,n #下一个子会话。Ctrl + a,w #子会话列表。创建一个叫做python的会话。

2021-06-02 20:25:21 239

转载 SQL基础

数据库表一个数据库通常包含一个或多个表。每个表有一个名字标识(例如:“Websites”),表包含带有数据的记录(行)。use RUNOOB; 命令用于选择数据库。set names utf8; 命令用于设置使用的字符集。SELECT * FROM Websites; 读取数据表的信息。SQL 对大小写不敏感:SELECT 与 select 是相同的。某些数据库系统要求在每条 SQL 语句的末端使用分号。分号是在数据库系统中分隔每条 SQL 语句的标准方法,这样就可以在对服务器的相同请求中

2021-03-06 16:43:20 247

原创 Counterfactual Explanations for Machine Learning: A Review

Counterfactual Explanations for Machine Learning: A Review机器学习的社会意义建立公平性和使自动化工具的决策具有可解释性是我们可以确保机器学习对社会产生公平影响的两种主要方法。公平性研究旨在开发算法,以确保系统产生的决策不会偏向特定的人口统计学群体,这些群体是根据敏感特征(例如种族,性别,宗教信仰)定义的。反歧视法律规定,使用敏感功能作为任何决定的基础是非法的。有偏见的决策也可能引起广泛的批评,因此对于避免此类行为很重要。关联关联可以理解成找相

2021-02-26 20:46:11 692

原创 Explainable Artificial Intelligence Approaches: A Survey

Explainable Artificial Intelligence Approaches: A Survey现有的一些工具:LIME, DeepVis Toolbox, TreeInterpreter, Keras-vis, Microsoft InterpretML, MindsDB, SHAP, Tensorboard WhatIf, Tensorflow’s Lucid, Tensorflow’s Cleverhans解释方法分为三类:Intrinsically Interpretable M

2021-02-26 20:39:50 451

原创 Multi-view Integration Learning for Irregularly-sampled Clinical Time Series

Multi-view Integration Learning for Irregularly-sampled Clinical Time Series介绍问题电子健康记录(EHR)数据==稀疏且不规则==,因为它以不规则的时间间隔记录,并且在每个观察点测量不同的临床变量。不同数量的观察值和跨数据的时间对齐方式的缺乏使假定具有固定维特征空间的机器学习模型的使用无效。研究进展研究背景:基于RNN的方法已成为处理临床时间序列数据的实际解决方案,因为RNN可以管理各种长度的顺序数据。但是传统的RNN方法

2021-02-26 20:21:38 433 2

原创 微信8.0自动发送炸弹python脚本

import itchatimport argparsedef get_arguments(): parser = argparse.ArgumentParser(description='文献表情包发送') parser.add_argument('--name', type=str, default="xxx", help='要发送的人的微信备注') parser.add_argument('--group', type=

2021-01-27 15:45:41 8146 2

原创 指定GPU训练模型

指定GPU训练模型1、直接在终端运行时加入相关语句实现指定GPU的使用运行test.py文件时,使用编号为0的GPU卡CUDA_VISIBLE_DEVICES=0 python test.py运行test.py文件时,使用编号为0和2的GPU卡CUDA_VISIBLE_DEVICES=0,2 python test.py2、在Python程序中添加使用第一张与第二张GPU卡import osos.environ["CUDA_VISIBLE_DEVICES"] = "1, 2"..

2020-12-30 09:57:58 1484 1

原创 命令行选项、参数和子命令解析器

命令行参数def get_arguments(): parser = argparse.ArgumentParser(description='sequence to point learning \ example for NILM') parser.add_argument('--data_dir', type=str, default=DATA_DIRECTORY,

2020-12-24 16:11:03 169 1

原创 python下载源更改

conda添加国内镜像源conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/freeconda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/mainconda config --set show_channel_urls yes换回默认源conda config --remove-key c

2020-12-22 16:38:59 1218

原创 NILM非侵入式负荷监测环境搭建

配置NILMTK深度学习环境下载miniconda安装minicondabash

2020-12-22 15:33:06 638 1

原创 安装tensorflow,pytorch并测试GPU是否可用

测试GPU是否可用tensorflowimport tensorflow as tfprint(tf.test.is_gpu_available())pytorchimport torchprint(torch.cuda.is_available())输出True代表可用

2020-12-21 20:29:26 455 1

原创 三分类SHAP图(特征标准化之后怎么画)

画三分类SHAP图出错今天干了一件很蠢的事情,还耽误了很多时间,特此记录一下我将数据标准化之后训练模型,然后将未标准化的数据作为输入计算了SHAP值,得出的结果显然不对。类似于下图这种但是如果画图时将X_test输入作为参数,那么横坐标就对应的是标准化之后的值,所以我们可以先对X_test未经标准化时候制作一个copy版本X_test1,然后作为画图时候参数输入就可以正确画出SHAP图的横坐标了,也可以得到我们想要的信息。另外三分类shap values得到一个3维数据,有时候使用起来需要切片,比如

2020-11-23 20:12:05 6668 7

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除