自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1073)
  • 收藏
  • 关注

原创 shell命令资料(Cookbook)

shell命令cookbook

2025-05-31 20:27:22 1359 1

原创 SLURM: sbatch的hint参数介绍和解释

参数用于向调度器提供关于 CPU 资源绑定(CPU affinity)或硬件特性的提示,帮助 Slurm 更智能地分配计算资源,尤其是在多核、NUMA 或异构架构系统中。是 Slurm 作业调度系统中用于提交批处理作业的命令。是互斥的,不能同时指定。

2026-01-03 19:51:46 583

原创 数值计算: FMA浮点数指令介绍

维度传统 MUL+ADDFMA舍入次数2 次1 次(精度更高)指令数≥21吞吐量较低高(尤其向量化时)适用场景通用HPC、AI、数值敏感计算控制方式默认行为需显式调用或编译器优化✅建议:在高性能数值计算中,主动利用 FMA(通过std::fma或编译器优化),但需验证数值稳定性;在要求严格可重现性时,注意跨平台一致性。

2026-01-03 10:23:56 370

原创 数值计算: 浮点数计算一致性介绍和解释

计算机浮点数计算的一致性(floating-point reproducibility)是一个在科学计算、数值模拟、金融建模和机器学习等领域高度关注的问题。以下从原理、原因和应对策略三方面进行系统性介绍。等多种因素影响,从而导致。的计算在不同环境下产生。

2026-01-03 10:13:31 588

原创 数值计算: IEEE754浮点数

一个浮点数包括三部分: 符号部分(Sign)、指数部分(Exponent)、分数部分(Fraction)一些特殊双精度数(调用std::numeric_limits<double>获取)一些特殊单精度数(调用std::numeric_limits<float>获取)

2026-01-03 10:09:19 1242

原创 SLURM: sbatch脚本调试

目标方法验证参数是否合法(不提交)查看实际生效的 Slurm 环境变量提交一个的轻量作业调试脚本中的参数在脚本中加入和env。

2026-01-03 09:39:08 615

原创 MPI: PMIx标准化进程管理接口

现代 MPI 实现(如 Open MPI ≥ v4.0、MPICH ≥ v4.0)默认通过 PMIx 获取作业信息,无需用户干预。PMIx(Process Management Interface for Exascale)是一个为。(如 MPI 实现、OpenSHMEM、任务调度器等)之间提供统一、可扩展、高效的通信机制。注意:Open MPI 默认已编译 PMIx 支持;)会在作业启动时自动与 PMIx 服务通信。(特别是 Exascale 级别)设计的。(如 Slurm、PBS、LSF)与。

2026-01-03 08:10:45 534

原创 Taskflow: C++复杂任务依赖图的并发任务调度库

(task dependency graphs),并利用高效的工作窃取(work-stealing)调度器在多核 CPU 上实现并行执行。,尤其适合用于构建 DAG(有向无环图)驱动的并行应用,如机器学习流水线、物理仿真、构建系统、自动化测试等。GitHub 主页:https://github.com/taskflow/taskflow。✅ 应用场景:并行遍历树、分治 FFT、动态任务生成(如游戏 AI 行为树)。✅ 应用场景:状态机、运行时策略选择、错误恢复路径。适用于递归、分治、运行时展开的任务结构。

2026-01-02 20:53:25 993

原创 Google DeepMind介绍

Google DeepMind 是一家总部位于英国伦敦的人工智能公司,成立于2010年,由 Demis Hassabis、Shane Legg 和 Mustafa Suleyman 共同创立。2014年,DeepMind 被 Google(现为 Alphabet Inc. 旗下公司)收购,成为其全资子公司,但仍保持相对独立的运营和研究方向。

2025-12-26 19:53:38 931

原创 DeepMD-kit: 深度学习的分子动力学(MD)模拟工具包

(Deep Potential Molecular Dynamics Kit)是一个基于深度学习的分子动力学(MD)模拟工具包,主要用于构建高精度、高效率的。(如 DFT)计算数据中学习原子间的相互作用势(能量、力、应力),从而代替昂贵的量子力学计算,在保持近似 DFT 精度的同时,实现接近经典力场的计算速度。(DP Technology)等团队主导开发,广泛应用于材料科学、物理、化学和生物等领域的多尺度模拟。✅ 大尺度长时间 MD(>1 ns,>百万原子)✅ 液态/非晶体系模拟(水、熔盐等)

2025-12-26 19:49:08 669

原创 MuJoCo: 开源的高性能物理仿真引擎

MuJoCo 的设计理念不仅是“更好的仿真器”,更是。的研究与开发领域而设计,广泛应用于。

2025-12-26 19:45:33 870

原创 Simbody: C++ 多体动力学(Multibody Dynamics)与物理仿真库

如果你有具体应用场景(如机器人仿真、人体步态、车辆悬架等),可以进一步探讨如何用 Simbody 建模。项目的一部分,广泛用于科研、教育以及开源仿真项目(如。Simbody 使用。

2025-12-26 19:22:00 945

原创 ONERA法国航空航天研究院

Office National d’Études et de Recherches Aérospatiales)是法国国家级的航空航天研究机构,成立于1946年,直属法国国防部,是欧洲最重要的航空航天科研机构之一。ONERA 自主开发了一系列高精度、高可信度的数值仿真和分析软件,广泛用于欧洲航空航天工业(如 Airbus、Safran、Thales、Dassault Aviation)以及科研合作项目(如 ESA、EU 框架计划)。法国航空航天研究院((与 DLR 合作)

2025-12-19 13:32:33 617 1

原创 CFD: Cassiopee前后处理网格可视化工具

是一个由法国航空航天研究院(ONERA)开发的开源 Python 库,主要用于。它尤其擅长处理结构化和非结构化网格,并支持多种主流 CFD 格式(如 CGNS、VTK、SU2、Plot3D 等),广泛应用于科研和工程领域。

2025-12-19 13:29:37 978

原创 PINN(Physics-Informed Neural Networks,物理信息神经网络)数学原理

PINN(Physics-Informed Neural Networks,物理信息神经网络)是一类将物理规律(通常以偏微分方程 PDE 的形式)嵌入神经网络训练过程中的深度学习方法。传统数值方法(如有限元、有限差分)通过离散网格求解;而 PINN 使用一个神经网络。(如 PyTorch/TensorFlow 的 autograd)计算,无需网格。(如 Dirichlet、Neumann)在域内随机或规则采样点。

2025-12-19 11:55:02 1280

原创 CMake: target_link_libraries() 函数可见性说明符PUBLIC,PRIVATE,INTERFACE

函数用于指定目标(如可执行文件或库)的链接依赖。时影响依赖的传递行为。下面分别说明其含义,并辅以示例。对于可执行文件(executable),(包括头文件路径、编译定义等,如果。的目标都会继承这个依赖。(因为可执行文件没有“使用者”)。注意:这些说明符只对。在 CMake 中,

2025-12-16 17:36:12 578

原创 High Performance Computing Center North(HPC2N),瑞典超算中心

该中心依托瑞典北部的高校与研究机构合作建立,旨在聚合区域优势资源,为全国科研与产业用户提供先进的计算基础设施与专业技术支持。,即“高性能计算中心北区”,是瑞典国家级的高性能计算(HPC)中心,位于瑞典北部,由多所大学和研究机构联合组成。的应用场景,反映了现代科研对多样高性能计算资源的需求。HPC2N 支持的计算应用不仅包括传统的。

2025-12-13 16:53:54 228

原创 jsonnet介绍和使用

(以及兼容格式如 YAML、TOML)。它由 Google 开发,旨在解决纯 JSON 在配置管理、模板复用和逻辑表达方面的不足。,用于以结构化、可编程的方式生成。示例:生成 YAML 配置。Jsonnet 是一种。

2025-12-12 17:31:06 784

原创 OpenCFS: 多物理场有限元仿真框架

(Open Computational Field Simulation)是一个开源的多物理场有限元仿真框架,主要用于求解耦合的偏微分方程系统,特别适用于。若需从源码编译 PETSc/SLEPc(推荐以获得最佳兼容性),请参考 OpenCFS 官方文档。OpenCFS 主要面向 Linux 开发环境,官方提供 CMake 构建系统。,如:电磁生热 → 热膨胀 → 结构变形。编译后生成可执行文件。

2025-12-12 17:21:16 960

原创 CFD: HORSES3D/HORSES3D_GPU高性能多物理场复杂流体求解器

是一个由西班牙马德里理工大学(UPM)NUMATH 团队开发的开源高性能多物理场求解器,采用。编写,专为求解复杂流体问题而设计。它支持多种物理模型和先进的数值方法,适用于科研和工程模拟。

2025-12-12 10:47:15 922

原创 CFD: NASA OVERFLOW(Overset Grid Solver for Flow Simulation)流体仿真求解器

(Overset Grid Solver for Flow Simulation)是由美国国家航空航天局(NASA)开发的一套。,OVERFLOW 是业界标杆工具之一。若受限于获取权限,可考虑研究其文献方法并在。流场,广泛应用于航空航天领域的气动分析和设计。,主要用于模拟复杂几何外形周围的。

2025-12-12 10:23:40 731

原创 CFD: 曲线坐标网格(Curvilinear Grids)资料

是一种广泛用于复杂几何外形模拟的网格类型,尤其适用于贴体(body-fitted)求解。与结构化直角坐标网格不同,曲线坐标网格通过坐标变换将物理域中的复杂边界映射到计算域中的规则矩形(或立方体)区域,从而便于使用高精度的有限差分或有限体积方法。在计算流体力学(CFD)中,

2025-12-12 10:21:06 470

原创 Obsidian个人知识管理(PKM)工具

本地优先 & 数据开放所有笔记以纯文本 Markdown(.md)格式保存在本地文件夹中,可使用任何编辑器打开。不依赖云端(可选同步),数据完全由用户掌控,利于长期存档。

2025-12-12 08:34:54 1079

原创 开源人脸识别工具

【代码】开源人脸识别工具。

2025-12-11 17:29:35 900

原创 CVAT(Computer Vision Annotation Tool)计算机视觉数据标注工具

官网开源地址许可证:MIT(自 v2.0 起)部署方式:支持 Docker 本地部署、云部署(如 CVAT.ai 托管版本)

2025-12-11 17:22:17 513

原创 X-AnyLabeling:AI 驱动自动标注工具介绍

专为数据工程师和研究人员在工业级复杂任务中提供高效、精准的标注解决方案。支持 RESTful API,便于集成到现有标注平台或自动化流水线中。开发的一款功能强大、支持多模态的。

2025-12-11 17:20:29 685

原创 iFEM: Matlab有限元工具

是由加州大学欧文分校(UCI)的 Long Chen 教授开发的一个 MATLAB 有限元方法工具包,专注于 自适应有限元方法(Adaptive Finite Element Methods, AFEM)在二维和三维非结构化单纯形网格(三角形/四面体)上的实现。该工具包以 代码简洁、高效、易读 为设计目标,并引入了一种名为 “稀疏矩阵化”(sparse matrixlization)的创新 MATLAB 编程风格,通过大量使用 MATLAB 的稀疏矩阵及其运算来提升计算效率。https://lyc102.g

2025-12-11 16:28:29 505

原创 COO格式稀疏矩阵进行Permutation置换操作

(Coordinate Format)的稀疏方阵 ( A \in \mathbb{R}^{n \times n} ) 应用。字典序排序(便于后续转换为 CSR 或其他格式)。对应于将每个 COO 元素的行/列索引通过。其中 ( P ) 是由给定的一维排列数组。(0-based),其逆排列。对 COO 格式的三元组。,那么恢复原矩阵只需应用。COO 格式通常要求按。

2025-12-11 14:42:02 913

原创 Linux系统多线程上下文切换(context switch)的 CPU 时钟耗时

/ 两个线程通过 pipe 或 futex 互相唤醒,测量切换延迟 // 参考:https://github.com/lemire/contextswitch。

2025-12-10 19:17:13 326

原创 CPU跳转指令的时钟开销

跳转类型预测成功开销预测失败开销无条件直接跳转~0 周期不适用条件跳转(预测正确)~0 周期条件跳转(预测错误)10~20 周期在高性能代码中(如 HPC、数值模拟),避免不可预测的分支是关键优化方向(例如用查表、位运算、SIMD 掩码替代条件跳转)。

2025-12-10 17:52:26 235

原创 汇编级别调用一个函数call指令的开销

情况时钟周期(cycles)最佳(直接调用、预测命中、小函数)1–3典型(有栈操作、常规调用)3–10最坏(间接调用、预测失败、cache miss)20–100+

2025-12-10 17:29:38 365

原创 Ubuntu 下用 Python 编写一个简单的 FTP 服务器

在 Ubuntu 下用 Python 编写一个简单的 FTP 服务器非常方便,可以使用标准库中的。如果你希望长期运行,可以创建 systemd 服务,但对“简单服务器”通常直接前台运行即可。为你实际想共享的目录路径,并确保该目录存在且有读写权限。如有需要,也可以用 Python 标准库。(第三方库)来快速实现。如果你使用的是系统 Python(如。在另一终端(或另一台机器)使用。编写 FTP 客户端来测试。

2025-12-10 15:05:14 276

原创 Chrono: multiphysics and multibody dynamics simulations多物理场仿真

它由 Project Chrono 社区维护,广泛应用于学术界、工业界和政府机构的科研与工程仿真任务中。可在机器人或自动驾驶仿真中添加 3D LiDAR,并输出点云数据,配合 ROS2 发布。是一个开源、跨平台的多物理场仿真软件包,采用。

2025-12-10 14:36:45 876

原创 AMGX: structure_reuse_levels字段设置和使用

相关的重要参数,用于控制在多次求解过程中如何重用 AMG 层次结构(hierarchy)。如需结合具体代码示例(如多时间步求解或与 PETSc 集成),可进一步说明使用环境。(例如时间推进中的隐式求解)时,重复构建这个结构将带来不必要的开销。的情况下,才应启用结构重用。否则可能导致数值错误或求解失败。⚠️ 重要:如果矩阵结构(即非零元的位置)发生变化,必须。(包括粗化策略、插值算子、粗网格矩阵等)。AMG 方法的核心在于构建一个从细网格到粗网格的。以明确启用矩阵结构重用。

2025-12-10 12:27:56 256

原创 SLURM: sbatch作业申请资源示例

脚本中,可以通过指定相应的 SBATCH 指令来请求不同类型的计算资源,包括 CPU 核心数、线程(逻辑 CPU)、GPU、内存等。以下是详细的说明与示例。若节点有 32 核(64 线程,开启超线程),则刚好用满。⚠ 超线程(Hyper-Threading)相关的线程数通常不需显式指定。如果你使用的是特定集群(如 LSF、Slurm 集群有自定义配置),建议运行。的语法取决于集群管理员如何设置 Partition 和 GRES 类型。或咨询管理员了解 GRES(如 GPU)的命名规则和可用类型。

2025-12-08 19:00:35 817

原创 SLURM: 单节点环境中部署 SLURM,统一管理 CPU 和 GPU 资源

在单节点环境中部署 SLURM(Simple Linux Utility for Resource Management)并使其统一管理 CPU 和 GPU 资源,是一个典型的 HPC 节点配置。以下是完整的部署和配置步骤,适用于 Ubuntu/Debian 或 CentOS/RHEL 等主流 Linux 发行版。参考官方:https://slurm.schedmd.com/quickstart_admin.html。下面是一个适用于你描述节点(2 sockets, 多核, 4 GPU)的最小。

2025-12-08 18:53:35 923

原创 SLURM: Job Step(作业步骤)概念介绍和使用

如你在使用 Job Arrays(作业阵列),每个 Array Task 是一个独立的 Job,每个 Job 内仍可包含多个 Steps。三个 Steps 依次运行,每个 Step 的资源使用可通过。如有具体使用场景(如 MPI/OpenMP 混合、GPU 任务等),可进一步定制 Step 的资源绑定方式(如。是一个非常重要的概念,用于对一个 SLURM 作业(Job)内部进行更细粒度的任务划分和资源管理。注意:并行 Steps 会共享 Job 的资源池,需确保总资源不超限。命令在已分配的资源上启动。

2025-12-08 18:44:50 1030

原创 SLURM: Job Array(作业数组)

配置项作用范围说明整个作业数组定义子任务 ID 范围每个子任务每个 task 的 CPU 数--mem每个子任务内存请求--nodes每个子任务每个 task 强制使用 N 个完整节点(慎用)%K(如整个数组最多 K 个 task 同时运行。

2025-12-08 17:00:59 1158

原创 MATLAB: BVP边值问题求解器bvp4c和bvp5c

y: 解向量,p: 未知参数(可选)end% 必须为零向量end。

2025-12-07 08:05:18 814

原创 Python: 求解常微分方程(ODE)的边值问题(Boundary Value Problem, BVP)

问题类型实现技巧多点边界(如 (y(2)=1))分段网格 + 连续性匹配非线性边界直接写入bc函数(可含乘积、指数等)未知参数使用p参数,高阶 ODE转为一阶系统(状态增广)

2025-12-05 14:44:24 973

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除