- 博客(62)
- 收藏
- 关注
原创 MPI4.1文档 -- 阻塞接收与其状态处理
本博客参考官方文档进行介绍,全网仅此一家进行中文翻译,走过路过不要错过。MPI-4.1为2023年11月2日发表,本专栏开始书写日期2024/3/18,当时最新版本4.1本人会维护一个总版本,一个小章节的版本,总版本会持续更新,小版本会及时的调整错误和不合理的翻译,内容大部分使用chatGPT 3.5翻译,内容不引用文献,请自行去文档查看;
2024-04-07 11:59:03
717
原创 MPI4.1文档翻译(持续更新)
这份文档描述了消息传递接口(MPI)标准,版本为4.1。MPI标准包括点对点消息传递、集合通信、组和通信器概念、进程拓扑、环境管理、进程创建和管理、单边通信、扩展集合操作、外部接口、输入输出、一些杂项主题以及多种工具接口。C语言和Fortran语言的语言绑定已定义。MPI-1.0(1994年5月5日):首次发布。MPI-1.1(1995年6月12日):小更新和错误修复。MPI-1.2(1997年7月18日):几处澄清和补充。
2024-03-24 11:37:18
1725
2
原创 MPI4.1文档1-MPI总览与各版本介绍
这份文档描述了消息传递接口(MPI)标准,版本为4.1。MPI标准包括点对点消息传递、集合通信、组和通信器概念、进程拓扑、环境管理、进程创建和管理、单边通信、扩展集合操作、外部接口、输入输出、一些杂项主题以及多种工具接口。C语言和Fortran语言的语言绑定已定义。MPI-1.0(1994年5月5日):首次发布。MPI-1.1(1995年6月12日):小更新和错误修复。MPI-1.2(1997年7月18日):几处澄清和补充。
2024-03-18 21:01:45
1622
原创 Pytorch NLP入门3:用嵌入表示单词
嵌入(Embedding)的概念是将单词映射到向量中,这反映了单词的语义含义。其向量的长度是嵌入维度的大小。我们稍后会讨论如何构建有意义的单词嵌入,但现在让我们将嵌入视为降低单词向量维度的一种方式。因此,嵌入层会接受一个单词作为输入,并产生一个指定嵌入尺寸的输出向量。在某种意义上,它与线性层非常相似,但它不是接受独热编码向量作为输入,而是可以接受单词编号作为输入。
2024-03-17 13:02:50
1317
原创 pytorch CV入门 - 汇总
初次编辑:2024/2/14;最后编辑:2024/3/9参考网站-微软教程:https://learn.microsoft.com/en-us/training/modules/intro-computer-vision-pytorch更多的内容可以参考本作者其他专栏:Pytorch基础:https://blog.csdn.net/qq_33345365/category_12591348.htmlPytorch NLP基础:https://blog.csdn.net/qq_33345365/cat
2024-03-16 10:24:44
1490
原创 onnx runtime文档学习5-加速Pytorch之Pytorch推理
本教程第一篇:介绍ONNX Runtime(ORT)的基本概念。本教程第二篇:是一个快速指南,包括安装ONNX Runtime;安装ONNX进行模型输出;Pytorch, TensorFlow和SciKit的快速开始例子本教程第三篇:CUDA Execution Provider本教程第四篇:介绍EP的相关概念,包括相关的架构。本教程第五篇:介绍Pytorch加速相关知识,首先介绍Pytorch 推理相关知识。包括比较pytorch推理,torchscipt推理和ONNXRuntime推理。
2024-03-13 09:27:06
1374
1
原创 硕士研究生三年生涯-西交计算机
奖学金准备:唱歌,委员,社团,方阵,运动会,比赛,论文。论文时期1:加分,工作,转春博,出国。论文时期2:工作,转秋博,出国。毕业论文+预答辩+盲审。论文时期3:工作,出国。我会依据情况持续进行调整。
2024-03-12 20:59:07
843
原创 onnx runtime文档学习4-Execution Providers (EP)架构
本教程第一篇:介绍ONNX Runtime(ORT)的基本概念。本教程第二篇:是一个快速指南,包括安装ONNX Runtime;安装ONNX进行模型输出;Pytorch, TensorFlow和SciKit的快速开始例子本教程第三篇:CUDA Execution Provider本教程第四篇:上一篇介绍CUDA EP,本教程介绍EP的相关概念,包括相关的架构。通过上面的介绍,可以得知模型可以运行在多个设备上,因此下一个教程,我们介绍加速pytorch代码相关的内容。
2024-03-12 09:23:34
1679
原创 onnx runtime文档学习3-CUDA provider
本教程第一篇:介绍ONNX Runtime(ORT)的基本概念。本教程第二篇:是一个快速指南,包括安装ONNX Runtime;安装ONNX进行模型输出;Pytorch, TensorFlow和SciKit的快速开始例子本教程第三篇(本博客):CUDA Provider。
2024-03-11 14:59:45
2351
原创 pytorch CV入门4-使用MobileNet解决视觉相关问题
在此模块中,你已了解卷积神经网络如何工作以及它们如何捕获二维图像中的模式。事实上,CNN 还可用于发现一维信号(如声波或时序)和多维结构(例如视频中的事件,其中某些模式在一些帧中重复)中的模式。此外,CNN 是用于解决更复杂的计算机视觉任务(如映像生成)的简单构建基块。生成对抗性网络可用于生成给定数据集中类似的映像,例如,可用于生成计算机生成的图画。同样,CNN 用于对象检测、实例分段等。我们还用单独的一节课程了解了如何实现神经网络来解决这些问题,我们建议你继续学习掌握计算机视觉!
2024-03-09 15:33:05
798
原创 pytorch CV入门3-预训练模型与迁移学习
使用迁移学习,我们能够快速地为我们的自定义对象分类任务组建一个分类器,并实现高准确率。然而,这个例子并不完全公平,因为原始的VGG-16网络是预先训练的,用于识别猫和狗,因此我们只是重复使用了网络中已经存在的大部分模式。您可以预期在更奇特的领域特定对象上,例如工厂生产线上的细节或不同的树叶上,准确率会更低。您可以看到,我们现在解决的更复杂的任务需要更高的计算能力,并且不能轻易在CPU上解决。在下一个单元中,我们将尝试使用更轻量级的实现来使用更低的计算资源训练相同的模型,这将导致略低的准确率。
2024-03-08 15:22:53
1360
原创 onnx runtime文档学习2-torch & TF简单示例
本教程第一篇:介绍ONNX Runtime(ORT)的基本概念。本教程第二篇(本博客):是一个快速指南,包括安装使用ONNX进行模型序列化和使用ORT进行推理。安装ONNX Runtime安装ONNX进行模型输出Pytorch, TensorFlow和SciKit的快速开始例子。
2024-03-05 16:03:56
1168
原创 pytorch基础6-加载并运行模型预测 & 总结
在本专题中,我们介绍了使用神经网络构建机器学习模型的关键概念,并使用PyTorch实现了这些概念。我们构建了一个图像识别模型,可以对图像进行分类,例如:T恤/上衣、裤子、套衫、连衣裙、外套、凉鞋、衬衫、运动鞋、包包和短靴。如何在CPU和GPU上使用张量如何管理、缩放和规范化数据集如何使用神经网络构建模型如何优化模型如何优化模型推理。
2024-03-04 14:56:11
2038
原创 pytorch基础5-优化循环
初次编辑:2024/3/4;最后编辑:2024/3/4本教程第一篇:介绍pytorch基础和张量操作本教程第二篇:介绍了数据集与归一化本教程第三篇:介绍构建模型层的基本操作。本教程第四篇:介绍自动微分相关知识。本教程第五篇:介绍优化循环(optimization loop)相关知识。
2024-03-04 13:11:31
853
原创 pytorch基础4-自动微分
初次编辑:2024/3/2;最后编辑:2024/3/3本教程第一篇:介绍pytorch基础和张量操作本教程第二篇:介绍了数据集与归一化本教程第三篇:介绍构建模型层的基本操作。本教程第四篇:介绍自动微分相关知识,即本博客内容。
2024-03-03 17:06:56
1069
原创 pytorch基础3-构建模型层
神经网络是由神经元(neurons)通过层连接而成的集合。每个神经元是一个小型计算单元,执行简单的计算以共同解决问题。神经元分布在三种类型的层中:输入层、隐藏层和输出层。隐藏层和输出层包含多个神经元。神经网络模仿人类大脑处理信息的方式。一个层包含多个神经元,一个神经网络包含多层,我们通过子类化nn.Module来定义我们的神经网络,并在__init__中初始化神经网络层。每个nn.Module子类在forward方法中实现对输入数据的操作。输入层具有 28x28 或 784 个特征/像素。
2024-03-03 12:49:09
910
原创 pytorch基础2-数据集与归一化
Dataset逐个样本检索数据集的特征和标签。在训练模型时,通常希望以“minibatch”的形式传递样本,在每个周期重混洗(reshuffle)数据以减少模型过拟合,并使用Python的多进程加速数据检索。在机器学习中,需要指定数据集中的特征和标签。**特征(Feature)**是输入,**标签(label)**是输出。我们训练特征,然后训练模型以预测标签。特征是图像像素中的模式。标签是10个类别类型:T恤,凉鞋,连衣裙等。DataLoader是一个可迭代对象,用简单的API抽象了这种复杂性。
2024-03-02 18:46:14
1895
原创 pytorch基础1-pytorch介绍与张量操作
大多数机器学习工作流程都涉及处理数据、创建模型、使用超参数优化模型、保存和推断已训练的模型。本模块介绍在 PyTorch 中实现的完整机器学习(ML)工作流程,PyTorch 是一种流行的 Python ML 框架。本教程使用 FashionMNIST 数据集来训练一个神经网络模型,该模型可以识别图像,如 T 恤/上衣、裤子、套衫、连衣裙、外套、凉鞋、衬衫、运动鞋、包包或短靴。在构建模型之前,会展示构建神经网络模型的关键概念。学习如何在 CPU 和 GPU 上使用张量(Tensors)
2024-03-01 20:43:31
1392
原创 onnx runtime文档学习1-介绍与架构
ONNX Runtime是由微软公司开发和维护的深度学习推理框架。是一个跨平台的机器学习模型加速器,具有灵活的接口,可以集成硬件特定的库。ONNX Runtime 可以与 PyTorch、Tensorflow/Keras、TFLite、scikit-learn 和其他框架中的模型一起使用。
2024-02-29 15:16:54
3545
原创 onnx 1.16 doc学习笔记8:API-Protos
onnx作为一个通用格式,很少有中文教程,因此开一篇文章对onnx 1.16文档进行翻译与进一步解释,onnx 1.16官方文档:https://onnx.ai/onnx/intro/index.html](https://onnx.ai/onnx/intro/index.html),开始编辑时间:2024/2/28;最后编辑时间:2024/2/28。这是本教程的第七篇,其余内容见上述专栏链接。
2024-02-28 10:58:27
1168
论文:A hybrid CPUGPU Scheme for Optimizing ChaCha20 Stream Cipher
2024-03-15
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人