- 博客(213)
- 资源 (2)
- 收藏
- 关注
原创 PPO算法实践(基于cleanrl)
本文主要介绍了深度强化学习cleanrl算法库中PPO算法的实现,以及对其实现为了适配自定义环境进行修改。
2024-11-25 22:14:57
1411
原创 golang变量常见问题总结
总结关于golang变量中的常见问题:1. 值类型和引用类型都有哪些;2. 值类型和引用类型的区别;3. 变量是否等于nil;4. 能否进行等值比较;5. 能否不分配内存直接添加元素
2024-04-28 15:09:57
1102
原创 Cookie、Session、Token、JWT
主要对Cookie、Session、Token、JWT做了简单介绍,并且对JWT在Gin框架中的使用以一个demo的形式进行了演示。
2024-03-09 16:10:03
1136
原创 go-zero入门
本文简单介绍了go-zero,以及go-zero相关的安装配置。通过go-zero的hello world级别的一个的单体应用和一个包含两个服务的微服务应用,以实践的方式展示了go-zero项目的入门级搭建。
2024-03-05 15:32:40
1312
1
原创 MapReduce概述
MapReduce是由Google设计,开发和使用的一个系统,相关的论文在2004年发表。Google当时面临的问题是,他们需要在TB级别的数据上进行大量的计算。
2024-01-22 19:25:22
1001
原创 分布式一致性算法---Raft初探
在本文结合Raft论文和mit 6.5840(原6.824)的lab2的partA和partB实验对Raft算法的基础概念以及两大重要部分投票选举和日志同步对Raft算法进行了细致的讨论。
2024-01-22 17:03:16
1205
原创 Go语言数据结构(一)双向链表
Go语言中list容器定义在"container/list"包中,实现了一个双向链表。本文第一部分总结源码包中的方法,第二部分展示使用list包的常见示例用法以及刷题时的用法。
2024-01-15 19:42:25
1219
翻译 PPO算法实现的37个实现细节(3/3)9 details for continuous action domains
博客标题:The 37 Implementation Details of Proximal Policy作者:Huang, Shengyi;本文接上篇继续,本篇主要介绍与Mujoco类型的环境的场景下,实现PPO算法的9个实现细节。
2023-10-27 16:56:22
997
翻译 PPO算法实现的37个实现细节(2/3)9 Atari-specific implementation details
博客标题:The 37 Implementation Details of Proximal Policy作者:Huang, Shengyi;本文接上篇继续,本篇主要介绍与Atari类型的游戏环境的场景下,实现PPO算法的9个实现细节。
2023-10-26 10:57:24
547
翻译 PPO算法实现的37个实现细节(1/3)13 core implementation details
翻译PPO算法实现的37个细节博客,原文标题The 37 Implementation Details of Proximal Policy Optimization。
2023-10-25 22:03:52
1700
原创 PPO算法逐行代码详解
本文会从理论部分、代码部分、实践部分三方面进行PPO算法的介绍。其中理论部分会介绍PPO算法的推导流程,代码部分会给出PPO算法的各部分的代码以及简略介绍,实践部分则会通过debug代码调试的方式从头到尾的带大家看清楚应用PPO算法在cartpole环境上进行训练的整体流程,进而帮助大家将理论与代码实践相结合,更好的理解PPO算法。
2023-10-12 17:42:57
5472
4
原创 Atlas200 DK A2与Arduino进行UART串口通信
我们在做一些人工智能的应用开发时往往使用人工智能开发板作为上位机(比如我们的小滕),Arduino、stm32等作为下位机控制板,通过上位机进行人工智能模型的推理之后进而给下位机传输对应的控制命令实现智能控制。那么如何实现两者的通信呢?这个问题可以通过UART串口通信完成,这篇博客会回答这个问题,并给出具体的案例和详细的实现步骤。
2023-06-29 22:22:40
1371
14
原创 OpenMMLab AI实战营第二期(2)MMPose初体验
MMPose 是一款基于 Pytorch 的姿态估计开源工具箱,是 OpenMMLab 项目的成员之一,包含了丰富的 2D 多人姿态估计、2D 手部姿态估计、2D 人脸关键点检测、133关键点全身人体姿态估计、动物关键点检测、服饰关键点检测等算法以及相关的组件和模块,下面是它的整体框架:MMPose 由 8 个主要部分组成,apis、structures、datasets、codecs、models、engine、evaluation 和 visualization。
2023-06-02 17:44:43
1118
1
原创 OpenMMLab AI实战营第二期(1)计算机视觉与OpenMMLab概述
通过今天课程的学习,算是比较大的扩展了我的视野,近期主要学一些强化学习的知识,没有想到计算机视觉领域已经发展的这么迅猛,很多以前只是在脑海里想象的计算机视觉应用场景,原来OpenMMLab已经实现了。我比较对目标检测感兴趣,而且之后可能要用,这篇博客就先主要了解这个部分。
2023-06-01 21:30:43
621
原创 Tutorial 2:Modification of the Environment
通过本文章熟悉webots仿真环境中可定义的基本环境参数,比如物体位置、朝向、形状、物理属性、接触属性等
2023-03-22 10:51:21
506
原创 函数中传入int a和int *a和int &a的区别
在这个例子中,函数func接收一个int类型的引用参数a,实际上是将参数a作为变量x的别名传递给函数。在这个例子中,函数func接收一个int类型的指针参数a,传递的是参数的地址。在函数内部通过指针修改参数a的值,从而改变函数外部的变量x。在这个例子中,函数func接收一个int类型的参数a,传递的是参数的值。在函数内部修改参数a的值不会影响函数外部的变量x。在C++中,函数传参数可以使用值传递、指针传递和引用传递三种方式,分别对应了int a、int *a和int &a。
2023-03-14 18:43:02
3282
Lecture 2: Supervised Learning of Behaviors
2022-07-13
Lecture 1:Introduction and Course Overview
2022-07-11
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人