自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

HyperAI超神经

人工智能领域实验媒体,站在技术与人文的路口,读懂人工智能。

  • 博客(1269)
  • 收藏
  • 关注

原创 【持续更新中!图像-文本对数据集汇总】Stable Diffusion 3 重磅开源,超全图像生成必备训练数据集、教程汇总

Stability AI 已经正式开源 Stable Diffusion 3(简称 SD3)!SD3 是一个图像生成模型,只要给定一段描述性的文字,就能够创造出与之匹配的视觉作品。下图就是由 SD3 生成的图像。* prompt史诗级动漫作品:一位巫师在夜晚的山顶上向黑暗的天空施放宇宙咒语,咒语上写着「Stable Diffusion 3」,由五彩缤纷的能量组成在 SD3 的背后,是庞大的图像-文...

2024-06-13 11:00:53 3157

原创 【持续更新中!气象数据集汇总】气象局首次发布训练数据目录!CAMELS 美国天文气象数据集等上线官网

该数据集为论文 「Global prediction of extreme floods in ungauged watersheds」的研究数据,主要内容为 AI 模型生成的洪水重新分析 (1984-2021) 和重新预测 (2014-2021) 数据以及相应的 GloFAS 基准数据。数据集可鼓励在天气领域进行机器学习研究,方便在理解和减轻气候变化影响方面的工作。SEVIR 将多种天气传感模式组合并整合成一个单一的、可访问的数据集,该数据集可在云端免费访问,可供气象学家、数据科学家和其他研究人员使用。

2024-05-30 16:18:00 1705

原创 【持续更新中,图像分割数据集】字节发布 COCONut 入选 CVPR 2024,立即体验 Segment Anything 分割万物!|持续更新中!

随着计算机视觉技术的不断发展,图像分割在诸多领域展现出重要的应用价值。近年来,各种图像分割数据集如雨后春笋般涌现。上个月,字节跳动发布了首个大规模全景图像分割数据集「COCONut」,为这一领域的研究注入了新鲜血液。HyperAI超神经本周汇总了 10 个优质的图像分割数据集进行汇总和分析,以更好地推动相关研究的进展。除此之外,GitHub 上超火的项目「Segment Anything 分割万物...

2024-05-09 15:09:25 1062 1

原创 【持续更新中!数学数据集汇总】天才博士陶哲轩力荐数据集!含代码、中文竞赛题目、正向逆向问答对等

数学数据集持续更新中,建议收藏!欢迎投稿优质数据集

2024-04-23 20:19:00 1921

原创 【 vLLM 学习】Audio Language

vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。源码 examples/offline_inference/audio_language.py。*在线运行 vLLM 入门教程:零基础分步指南。更多 vLLM 中文文档及教程可访问 →。

2025-05-09 17:42:06 26

原创 vLLM 实战教程汇总,从环境配置到大模型部署,中文文档追踪重磅更新

10 个实用教程与模型案例快速掌握 vLLM

2025-05-09 16:03:29 376

原创 【 Triton 教程】triton.heuristics

values (dict[str, Callable[[list[Any]], Any]]**) - 包含元参数名称和计算元参数值的函数的字典。每个这样的函数都接受一个位置参数列表作为输入。Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。用于指定如何计算某些元参数值的装饰器。这在自动调优成本过高或不适用的情况下非常有用。更多 Triton 中文文档可访问 →。

2025-05-09 13:23:42 98

原创 性能远超SAM系模型,苏黎世大学等开发通用3D血管分割基础模型

苏黎世大学、苏黎世联邦理工学院和慕尼黑工业大学的团队提出了一个专为 3D 血管分割而设计的基础模型 vesselFM。该模型能够在零样本、单样本和少样本场景中实现优于现有先进模型的分割能力和泛化能力。

2025-05-08 16:36:33 552

原创 【 TVM 教程】使用 TVMC Micro 执行微模型

本教程介绍了如何为微型设备编译一个微模型,并在 Zephyr 平台上构建一个程序,来执行这个模型,烧录程序,并用 tvmc micro 命令来执行所有模型。在进行本教程之前你需要安装 python 和 Zephyr 依赖

2025-05-08 14:24:02 300

转载 性能远超SAM系模型,苏黎世大学等开发通用3D血管分割基础模型,入选CVPR 2025

如果把人的身体比作一座庞大的城市,那么血管无疑就是这座城市的「道路」,动脉、静脉以及毛细血管对应着高速公路、城市道路以及乡间小道,它们相互协作,通过血液将营养物质、氧气等输送到身体各处,从而维持着这座「城市」的高效、稳定运行。更令人相信的是,在不久的将来,或许血管类疾病将也将会随着人工智能应用的加深,而被逐渐攻克。具体来说,其广泛的临床成像包括 MRA、CTA、X 光片、双光子显微镜以及 vEM 等,生物样本来自人类、实验鼠的大脑、肾脏和肝脏等,这为研究提供了不同结构和功能特性的血管模式。

2025-05-08 11:02:00 3

原创 中日团队联合攻关,利用大模型解析氢化物固态电解质传导机制,建立可靠活化能预测模型

在活化能预测研究中,研究团队引入 8 个理论描述符:单元格体积 (V)、电负性 (X)、原子序数 (Z)、结合能 (bₘ)、阴离子间距 (d)、中性分子数量 (n)、原子半径 (ratom) 和离子半径 (rion),对闭式 (Closo-SSEs) 和巢式 (Nido-SSEs) 体系进行单一线性回归 (Single linear regressions) 及多重线性回归 (multiple linear regression) 分析。当前研究普遍存在的方法论碎片化问题,也限制了对材料体系的系统性理解。

2025-05-07 15:59:12 506

转载 中日团队联合攻关,利用大模型解析氢化物固态电解质传导机制,建立可靠活化能预测模型

基于 LLM 对实验与理论计算的基准测试分析,颠覆了对 SSE 阳离子迁移常用过渡态搜索方法的认知,揭示传统模拟方法与实验 Eₐ 差异显著,表明应优先采用更合理的方法,如 MetaD,尤其针对高 Eₐ 的 SSE。进一步分析发现,如下图 e-g 所示,这类 SSE 存在两个活化能值 (Eₐ₁ 和 Eₐ₂),分别对应阳离子移出配位环境及迁移到空位的过程,Eₐ₂ 与实验测量值接近,表明其可能是速率决定步骤。然而,SSE 材料体系的复杂性——尤其是氢化物中存在的多尺度离子迁移机制,仍对理论模型的精度构成挑战。

2025-05-07 11:02:34 1415

原创 入选CVPR 2025,哈工大团队提出分层蒸馏多示例学习框架HDMIL,快速处理千兆像素病理全切片图像

而不可否认的是,正是这些执着于科学前沿的「探索者」,才使得我们有机会享受人工智能和医学交叉融合后的应用。具体来看,首先从高分辨率 WSI (Xᵢ,ₕᵣ) 中提取的所有 patch 都被输入到预训的练特征提取器中,生成一组示例级特征 Iᵢ,ₕᵣ,然后继续输入到投射模块中进行降维,得到新的特征集 Fᵢ,ₕᵣ,之后继续输入到注意力模块中以计算未归一化的注意力分数。近年来,数字病理学的蓬勃发展引领了新一轮医学事业和生物学的进步,尤其是在对抗人类最大的敌人之一的癌症时,发挥着重要的作用。

2025-05-06 20:00:45 997

原创 解密英伟达芯片架构命名:科学巨匠的数字重生

早期,公司的首款芯片是基于「Fahrenheit」(华氏温标创始人)命名,而自 CUDA 诞生后(1998 年),Nvidia 开启了以科学家名称命名的新篇章,以此向 AI 领域的先驱们致敬,甚至曾出售一款员工专用 T 恤,上面印着几位著名科学家的卡通形象。数学上,Pascal 促成了两个重要的新研究领域。在博弈论、信息论和概率论等领域,他都有着重大贡献,而最为著名的当属 Rao - Blackwell 定理,该定理作为统计估计理论的基石,提供了增强估计量的系统方法,极大推动了统计学的发展。

2025-05-05 11:00:34 550

转载 会议报道 | 中国地理学会地理模型与地理信息分析专业委员会2025年学术年会在杭州成功举行

嘉宾们从理论演进、技术革新、应用拓展等维度各抒己见,思想的火花在智慧碰撞中迸发,为地理学科在人工智能浪潮下的发展路径提供新的思考与方向。本次会议由中国地理学会地理模型与地理信息分析专业委员会主办,浙江大学地球科学学院承办,卫星海洋环境监测预警全国重点实验室、全省资源与环境信息系统重点实验室(浙江省)、浙江省地理学会、浙江农林大学数学与计算机科学学院、杭州师范大学信息科学与技术学院、浙大城市学院国土空间规划学院、《地球信息科学学报》以及浙江中海达空间信息技术有限公司协办,超神经(天津)科技有限公司赞助。

2025-05-01 11:02:16 1

原创 在线教程丨Qwen3狂揽近20k star,网友实测:比Llama更快解决更难问题

值得一提的是,Qwen3-30B-A3B 的激活参数数量仅为 QwQ-32B 的 10%,但表现更胜一筹,甚至像 Qwen3-4B 这样的小模型也能匹敌 Qwen2.5-72B-Instruct 的性能。仅仅一天的时间便在 GitHub 斩获近 20k stars,而除了极高的讨论热度外,Qwen3 更是凭借性能的提升与部署成本的下探,一举问鼎开源大模型王座。X 用户 Jafar Najafov 对比了 Qwen3 与相同模型参数量的 Llama Qwen3 能更快地解决更难的问题。根据官方发布的数据,

2025-04-30 18:39:12 957

原创 入选ICLR 2025 Oral,清华AIR周浩团队提出蛋白质预训练新范式,解密蛋白质家族进化

ProfileBFN 作为蛋白质基座模型,能够在资源有限的情况下整合更多同源信息,充分利用特定先验信息,对多指标有良好的迁移作用,这无疑让它成为合成候选蛋白,定向进化的不二之选。随着技术的发展,深度生成模型输入的 MSA 深度不断增加,但是效果却遇到了瓶颈,这让添加 MSA 信息的性价比遭到了质疑。在数量上,对于某些「孤儿」蛋白质,同源序列可能不超过 10 条,而有些蛋白质能够搜索到超过 10,000 条同源序列,这给大模型造成了很大困惑,产生了资源的浪费和效率上的影响。

2025-04-29 16:54:27 674

原创 开发迄今最大的遥感指令数据集,IBM研究院等提出专为地球观测数据设计的VLM,入选CVPR 2025

该数据集的预训练策略聚焦于跨模态、跨分辨率、跨时相的泛化能力构建,通过从 SkyScript、SatlasPretrain 等专业平台筛选高质量问答指令对,整合了 Sentinel-2 光学影像、Sentinel-1 合成孔径雷达数据、NAIP 航空影像、Landsat 卫星影像等多源异构遥感数据,并同步配置地理标签信息。未来,随着多模态大模型、在轨智能处理、量子计算等技术融合,地球观测有望成为支撑碳中和、防灾减灾、资源管理等全球议题的数字基石,在人类与自然的共生关系中书写可持续发展的新篇章。

2025-04-28 16:16:43 863

原创 效率提升73倍!日本研究团队基于机器学习成功制备10种光驱动有机晶体

这种方法的效率是传统网格搜索法的 73 倍,极大地提升了光电机械分子晶体的适用性,并有助于优化功能晶体的其他特性。如上所述,当光驱动晶体发生形变时,物体能够施加力并做功,在这种情况下,当晶体的自由形变被完全阻止时,会产生一个最大力,这被定义为阻挡力 (blocking force),有效控制光驱动晶体的阻挡力对于其实际应用至关重要。由于在许多情况下,文献提供了材料多个方向的测量值(例如,沿不同的晶体学轴),因此,研究人员提取了每个相关的数据点,还纳入了弯曲测试数据和其他测量数据,以确保数据集的全面性。

2025-04-27 17:51:11 1022

原创 【vLLM 学习】CPU 离线处理

vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。更多 vLLM 中文文档及教程可访问 →。

2025-04-27 17:20:38 203

原创 【Triton 教程】triton_language.zeros

Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。,返回 1 个填充了标量值 0 的张量。更多 Triton 中文文档可访问 →。

2025-04-27 17:02:52 192

原创 【TVM教程】在 Arduino 上为 microTVM 训练视觉模型

​构建物联网设备时,通常想让它们能够看到并理解它们周围的世界。可以采取多种形式,但通常设备也会想知道某种物体是否在其视野中。例如,安全摄像头可能会寻找人,因此它可以决定是否将视频保存到内存中。红绿灯可能会寻找汽车,这样它就可以判断哪个信号灯应该首先改变。或者森林相机可能会寻找一种动物,从而估计动物种群的数量。为使这些设备价格合理,我们希望为这些设备配置一个低成本处理器,如nRF52840(在 Mouser 上每个售价 5 美元)或RP2040(每个只需 1.45 美元)。

2025-04-27 16:52:58 802

原创 「吉卜力」画风生成神器—EasyControl 一键启动;单图秒变 3D 模型,TripoSG 革新 3D 资产生成

该模型在 LiveCodeBench v5 (8/1/24-2/1/25) 上实现了 60.6% 的 Pass@1 准确率,比基本模型 (53%) 提高了 8%,并且只用 14B 参数实现了与 OpenAI 的 o3-mini 相似的性能。该模型基于 Qwen2.5-VL 在 R1-Onevision 数据集上微调而成,擅长处理复杂的视觉推理任务,无缝整合视觉和文本数据,在数学、科学、深度图像理解和逻辑推理等领域表现出色,可作为强大的 AI 助手解决各种问题。近期,吉卜力风格的图像席卷各大社交媒体。

2025-04-27 16:14:02 608

原创 12个HPC教程汇总!从入门到实战,覆盖分子模拟/材料计算/生物信息分析等多个领域

它通过并行处理、大规模计算资源的整合,极大提升了计算效率,使原本耗时数日的任务能够在数小时内完成。该教程将以硅晶体为例,通过 NpT 系综分子动力学,演示如何训练 vasp 机器学习力场,学习机器学习力场训练的基本流程:准备分子动力学输入文件、根据实际情况更改分子动力学和机器学习参数,并通过计算声子谱进行机器学习力场的简单验证。该教程将使用自动化脚本来使用 Phonopy 进行演示计算流程,学习比热容计算的基本流程:准备微扰差分超胞结构、计算所有结构的总能、计算力常数矩阵,根据力常数矩阵计算硅的比热容。

2025-04-25 17:00:32 952

原创 最大化挖掘临床MRI数据价值,UCL团队提出MindGlide模型,实现多发性硬化症病变量化

随后,研究人员进行了针对病变治疗效果的纵向验证,涉及多项实验,证明了 MindGlide 在治疗效果检测方面的有效性,如在 SPMS 和 PPMS 试验中,治疗组的病变体积累积量低于安慰剂组;针对模型训练的图像预处理,研究人员使用了一个最小的预处理管道,首先将图像分辨率标准化为 1 mm 各向同性体素,然后根据 nnU-Net 设计。近年来,人工智能的快速发展,使其在神经系统疾病方面的应用不断加快,并且由于其独特的工作机制和高效的方法,为医学界通过人工智能进行 MS 研究提供了新的思路。

2025-04-25 15:44:58 1057

原创 「吉卜力」画风生成神器—EasyControl 一键启动;单图秒变 3D 模型,TripoSG 革新 3D 资产生成

该模型在 LiveCodeBench v5 (8/1/24-2/1/25) 上实现了 60.6% 的 Pass@1 准确率,比基本模型 (53%) 提高了 8%,并且只用 14B 参数实现了与 OpenAI 的 o3-mini 相似的性能。本文是该研究的详细解读与分享。该模型基于 Qwen2.5-VL 在 R1-Onevision 数据集上微调而成,擅长处理复杂的视觉推理任务,无缝整合视觉和文本数据,在数学、科学、深度图像理解和逻辑推理等领域表现出色,可作为强大的 AI 助手解决各种问题。

2025-04-25 11:17:41 827

转载 倒计时3天!中国地理学会地理模型与地理信息分析专业委员会2025年学术年会

曹龙、柴登峰、范今朝、冯友建、付晓、黄智才、金平斌、李鸿威、李睿、梁鹏、林杰、刘婷、陆丽珍、欧阳安蛟、Steve Pratte、苏程、汪波、王琛、汪愿愿、吴宏海、徐流畅、杨小平、张德国、张兴平、章孝灿、章笑艺。中国地理学会地理模型与地理信息分析专业委员会拟于 2025 年 4 月 26-28 日在杭州举行 2025 年学术年会,HyperAI超神经作为官方合作媒体,将为大家带来一系列干货报道,敬请关注!会间住宿费、往返交通费自理。陈奕君、冯杰、胡林舒、刘彦君、戚劲、汪愿愿、严益明、杨纵林、姚亮、张笑聪。

2025-04-24 11:22:41 80

转载 最大化挖掘临床MRI数据价值,UCL团队提出MindGlide模型,实现多发性硬化症病变量化

随后,研究人员进行了针对病变治疗效果的纵向验证,涉及多项实验,证明了 MindGlide 在治疗效果检测方面的有效性,如在 SPMS 和 PPMS 试验中,治疗组的病变体积累积量低于安慰剂组;针对模型训练的图像预处理,研究人员使用了一个最小的预处理管道,首先将图像分辨率标准化为 1 mm 各向同性体素,然后根据 nnU-Net 设计。近年来,人工智能的快速发展,使其在神经系统疾病方面的应用不断加快,并且由于其独特的工作机制和高效的方法,为医学界通过人工智能进行 MS 研究提供了新的思路。

2025-04-24 11:22:41 47

原创 30分钟内输出结果,新加坡国立大学/MIT等基于SVM构建微生物污染检测模型

新加坡国立大学/MIT等提出了一种结合紫外吸收光谱与机器学习的检测方法,能在 30 分钟内完成细胞培养上清液的微生物污染检测。

2025-04-23 13:38:56 963

原创 多主体驱动生成能力达SOTA,字节UNO模型可处理多种图像生成任务

「UNO:通用定制化图像生成」教程已上线至 HyperAI超神经官网的教程板块中,欢迎体验!

2025-04-22 11:48:15 524

原创 入选AAAI 2025,浙江大学提出多对一回归模型M2OST,利用数字病理图像精准预测基因表达

中国浙江大学的林兰芬教授研究团队联合浙江杭州之江实验室以及日本立命馆大学共同提出了 M2OST,这是一种多对一回归 Transformer 模型,旨在利用不同层次的病理图像共同预测基因表达。

2025-04-21 13:36:14 1086

原创 【vLLM 学习】Aqlm 示例

vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。更多 vLLM 中文文档及教程可访问 →。

2025-04-18 17:39:20 310

原创 【Triton 教程】triton_language.full

Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。更多 Triton 中文文档可访问 →。返回一个张量,该张量填充了指定。

2025-04-18 17:32:40 226

原创 【TVM教程】microTVM TFLite 指南

​接下来为 Relay 创建一个构建配置,关闭两个选项,然后调用 relay.build,为选定的 TARGET 生成一个 C 源文件。当在与主机( Python 脚本执行的位置)相同架构的模拟 target 上运行时,为 TARGET 选择下面的「crt」,选择 C Runtime 作为 RUNTIME ,并选择适当的单板/虚拟机来运行它(Zephyr 将创建基于 BOARD 的正确 QEMU 虚拟机)。# 运行于物理硬件时,选择描述对应硬件的 TARGET 和 BOARD。

2025-04-18 17:01:21 390

原创 从数据集到开源模型,覆盖无机材料设计/晶体结构预测/材料属性记录等

HyperAI超神经为大家整理了当下热门的材料数据集以及一键部署教程,涵盖量子材料、无机材料、晶体结构等多个关键方向,快来使用吧~

2025-04-18 14:22:57 882

原创 覆盖40+主流模型及数据集,上海交大团队发布一站式蛋白质工程设计平台VenusFactory,一键部署教程已上线

上海交通大学洪亮教授课题组开发了一个专为蛋白质工程量身打造的一站式开放平台 VenusFactory,HyperAI超神经官网的教程版块已上线一键部署教程,欢迎体验!

2025-04-17 16:28:37 1060

原创 入选ICLR 2025,MIT/UC伯克利/哈佛/斯坦福等提出DRAKES算法,突破生物序列设计瓶颈

近日, MIT / UC 伯克利/哈佛/斯坦福等顶尖大学团队共同提出了创新性算法 DRAKES ,通过引入强化学习框架,首次在离散扩散模型中实现了对完整生成轨迹的可微奖励反向传播,在保持序列自然性的同时,显著提升下游任务性能。

2025-04-16 14:56:04 892

原创 在线教程丨媲美 o3-mini,开源代码推理模型 DeepCoder-14B-Preview 狂揽 3k stars

3.选择「NVIDIA GeForce RTX 4090」以及「vLLM」镜像,OpenBayes 平台提供了 4 种计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」,点击「继续执行」。目前「一键部署 DeepCoder-14B-Preview」教程已上线至 HyperAI超神经官网的教程板块中,模型克隆完成后进入「API 地址」即可快速体验模型!1. 登录 hyper.ai,在「教程」页面,选择「一键部署 DeepCoder-14B-Preview」,点击「在线运行此教程」。

2025-04-15 18:57:27 359

原创 酶动力学参数预测,瓶颈识别……中科院深圳先进技术研究院罗小舟分享AI在酶领域的创新应用

作为生命的基础分子,核酸、小分子脂类、糖类、代谢产物和离子、水等物质均产自蛋白质,基于这一特性,在 2019 年回国后,我将研究重点聚焦到蛋白质领域,并且提出了 3 个科学问题:首先是能否直接从蛋白质的序列预测出其活性和功能?蛋白质,作为生命的基石,在生命活动中发挥着关键作用,其结构和功能的研究,对创新药物研发、合成生物学、酶制剂生产等领域,有着极其重要的意义。但传统蛋白质设计面临诸多难题,蛋白质结构复杂,序列空间庞大,依赖专家经验和高通量筛选的设计方式,不仅耗时费力,成功率也难以保证。

2025-04-14 18:15:20 927

原创 【vLLM 学习】API 客户端

vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。更多 vLLM 中文文档及教程可访问 →。

2025-04-11 18:41:26 286

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除