自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 UBUNTU成功安装NVIDIA驱动,cuda,cudnn,解决循环登录问题

前言装过多次实验室服务器显卡驱动,踩过不少坑,这边觉得有必要记录下一套较为简单的安装方式,在下次遇到问题时可以迅速重装。一方面:如果你的显卡不是很古老,2019年底了,至少RTX-1060以上了吧,建议都使用较新版本驱动软件;另一方面:踩到坑,不能烦,心平气和解决问题;环境一切关于配置的问题不声明环境都是耍流氓系统:Ubuntu16.04 64bit双显卡:Nvidia...

2019-11-23 14:34:39 603

原创 记录几道商汤,旷视面试手撕代码题~

非科班出身,觉得还是有些难度的,可能自己刷题还不够吧,面试时基本上都是在面试官提点下写出,这里贴出来仅供参考~商汤:一面:输入给两个数组,一个数组内数字都是不重复的,要求输出一个数组,该数组只包含两个输入数组的所有相同元素,要求算法复杂度。eg:输入[3,10,4,9,7,8]和[6,8,10,4,2,1] 则输出[4,8,10]思路:先排序,后双指针遍历;...

2019-10-24 22:35:02 1475

转载 一文概览主要语义分割网络,FCN、UNet、SegNet、DeepLab 等等等等应有尽有

文章目录介绍 网络架构 Fully Convolution Networks (FCNs) 全卷积网络 SegNet U-Net DeepLab v1 DeepLab v2 DeepLab v3 Fully Convolutional DenseNet E-Net 和 Link-Net Mask R-CNN PSPNet RefineNet G-...

2019-08-25 11:33:57 2736

原创 【论文解读】 FPGA实现卷积神经网络CNN(三) 深鉴科技: Going Deeper with Embedded FPGA Platform for CNN

博主评论:深鉴科技是国内做FPGA实现CNN的高端玩家,2018年被Xilinx收购,现在专做移动端的深度学习加速,开发了端到端的深度学习加速框架DNNDK,博主实测加速效果(ZCU102开发板;计算能力>1.2Tops/s,引入ARM多线程可进一步达到>2Tops/s)。这篇2016年的文章是深鉴科技早期实现卷积神经网络加速的一篇硬核论文,文章写得很深入,这里只做个简要解读~...

2019-08-10 11:59:28 5237 1

原创 原创图像标记工具---Image labeler //标记行人特别版---especially for pedestrian

实验室采集了专有的行人数据集,我使用MATLAB GUI设计了一个用于标定行人数据集的Image labeler, 标记软件特色在于可以调用ACF行人检测算法先自动标记,后续使用鼠标修改或添加ROI就可以了,可以节省大量的标记时间。若想用于其它目标的自动标记,也可以下载我的matlab gui源文件,自行修改调用已有检测算法即可。软件功能介绍:1,自动标记行人2,手动修改ROI...

2019-07-31 10:52:26 962 1

原创 Xilinx-SDSoC-FPGA #pragma SDS data access_pattern 指令将BRAM 用作RAM/FIFO 解析

平台:ZCU102开发环境:SDSoC在做PS端与PL端数据通信时, 需要通过 #pragma SDS data access_pattern指令来指定FPGA综合生成PL端的硬件接口是RAM还是FIFO;指令语法:#pragma SDS data access_pattern(ArrayName:<pattern> )ArrayName: 传递的参数名&lt...

2019-07-02 13:20:38 918

转载 SDSoC软硬件协同设计—— SDS pragma 指令简介

目录SDS指令简介SDS Pragma组合HLS开发的流程,分成三步,首先在Vivado HLS工具中将C/C++转换成RTL代码并打包成IP核,然后在Vivado IPI中将HLS IP核与Zynq的PS集成在一起,最后在SDK中编写驱动完成整个设计。在这个流程中开发者需要根据应用特点选择合适的接口,合适的DMA,每一次调整都要先在HLS中调整,然后在Vivado更新IP,操作流程十...

2019-06-05 12:28:49 1446

原创 【论文解读】 FPGA实现卷积神经网络CNN(二): Optimizing FPGA-based Accelerator Design for DCNN

博主评论:这篇论文发表在2015年,是一篇FPGA实现CNN的高引用论文,该文从理论与实践结合展示了在FPGA上实现CNN。根据roofline模型分析计算峰值与CTC rate关系,深入探讨了CNN卷积层中的数据依赖关系,进行数据复用从而在内存带宽不变的情况下提升CTC rate,对不同循环分片参数的performance建模,并为每一层卷积选择通用的分片参数来避免复杂的硬件结构。值得一提的是...

2019-06-03 17:57:12 6725 1

转载 YUV格式介绍与转换

YUV格式有两大类:planar和packed。对于planar的YUV格式,先连续存储所有像素点的Y,紧接着存储所有像素点的U,随后是所有像素点的V。对于packed的YUV格式,每个像素点的Y,U,V是连续交*存储的。YUV,分为三个分量,“Y”表示明亮度(Luminance或Luma),也就是灰度值;而“U”和“V” 表示的则是色度(Chrominance或Chroma),作用...

2019-05-21 12:43:59 1514

原创 【论文解读】 FPGA实现卷积神经网络CNN(一): CNP: AN FPGA-BASED PROCESSOR FOR CONVOLUTIONAL NETWORKS

博主评论:目前在移动端部署深度学习推断的需求越来越多,博主认为这类需求属于边缘计算的一部分,目前移动端的主要方式有嵌入式ARM,NPU,FPGA等,然而早在2009年,在卷积神经网络之父Yann LeCun挂名的一篇论文里就提出了使用FPGA实现卷积神经网络推断,考察卷积神经网络并行性,并结合FPGA的高并行计算,对人脸检测达到了每秒十帧的速度,虽然现在网络复杂度变高,但同时FPGA计算能力也在...

2019-05-19 16:57:26 5614

转载 更改Ubuntu默认python版本

转自:https://blog.csdn.net/fang_chuan/article/details/60958329当你安装 Debian Linux 时,安装过程有可能同时为你提供多个可用的 Python 版本,因此系统中会存在多个 Python 的可执行二进制文件。一般Ubuntu默认的Python版本都为2.x, 如何改变Python的默认版本呢?下面来一起看看吧。你可以按照以下...

2019-05-08 22:39:19 304

原创 python中的main函数

python是一种解释型脚本语言,和C/C++语言不同,C/C++程序从main函数开始执行,python程序从开始到结尾顺序执行。先总结下python中的main函数的作用:让模块(函数)可以自己单独执行(调试),相当于构造了调用其它函数的入口,这就类似于C/C++里面的main函数了。一方面:我们想要自己单独执行(调试)这里我们实际调试一下(假设这个文件是test.py):#t...

2019-04-16 14:31:40 134556 13

原创 yolov3-tiny模型分析(含自己绘制的网络模型图)

最近在实验室做行人检测的项目,希望最后可以做到硬件上面去,所以挑选了yolov3的tiny版本。在实验室专有行人数据集下训练,检测效果还不错,在1080ti上推断速度达到了30fps, 这里和大家一起撸一下yolov3-tiny的网络结构:相比于yolov3, tiny版本将网络压缩了许多,没有使用res层(残差层),只使用了两个不同尺度的yolo输出层,但总体思路还是可以借鉴yolov3的。...

2019-04-04 22:36:26 33941 199

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除