HCYHanson-CSDN博客

原创 UBUNTU成功安装NVIDIA驱动，cuda，cudnn，解决循环登录问题

前言装过多次实验室服务器显卡驱动，踩过不少坑，这边觉得有必要记录下一套较为简单的安装方式，在下次遇到问题时可以迅速重装。一方面：如果你的显卡不是很古老，2019年底了，至少RTX-1060以上了吧，建议都使用较新版本驱动软件;另一方面：踩到坑，不能烦，心平气和解决问题;环境一切关于配置的问题不声明环境都是耍流氓系统：Ubuntu16.04 64bit双显卡：Nvidia...

2019-11-23 14:34:39 603

原创记录几道商汤，旷视面试手撕代码题~

非科班出身，觉得还是有些难度的，可能自己刷题还不够吧，面试时基本上都是在面试官提点下写出，这里贴出来仅供参考~商汤：一面：输入给两个数组，一个数组内数字都是不重复的，要求输出一个数组，该数组只包含两个输入数组的所有相同元素，要求算法复杂度。eg：输入[3,10,4,9,7,8]和[6,8,10,4,2,1] 则输出[4,8,10]思路：先排序，后双指针遍历；...

2019-10-24 22:35:02 1475

转载一文概览主要语义分割网络，FCN、UNet、SegNet、DeepLab 等等等等应有尽有

文章目录介绍网络架构 Fully Convolution Networks (FCNs) 全卷积网络 SegNet U-Net DeepLab v1 DeepLab v2 DeepLab v3 Fully Convolutional DenseNet E-Net 和 Link-Net Mask R-CNN PSPNet RefineNet G-...

2019-08-25 11:33:57 2736

原创【论文解读】 FPGA实现卷积神经网络CNN（三）深鉴科技： Going Deeper with Embedded FPGA Platform for CNN

博主评论：深鉴科技是国内做FPGA实现CNN的高端玩家，2018年被Xilinx收购，现在专做移动端的深度学习加速，开发了端到端的深度学习加速框架DNNDK，博主实测加速效果（ZCU102开发板；计算能力>1.2Tops/s，引入ARM多线程可进一步达到>2Tops/s）。这篇2016年的文章是深鉴科技早期实现卷积神经网络加速的一篇硬核论文，文章写得很深入，这里只做个简要解读~...

2019-08-10 11:59:28 5237 1

原创原创图像标记工具---Image labeler //标记行人特别版---especially for pedestrian

实验室采集了专有的行人数据集，我使用MATLAB GUI设计了一个用于标定行人数据集的Image labeler, 标记软件特色在于可以调用ACF行人检测算法先自动标记，后续使用鼠标修改或添加ROI就可以了，可以节省大量的标记时间。若想用于其它目标的自动标记，也可以下载我的matlab gui源文件，自行修改调用已有检测算法即可。软件功能介绍：1，自动标记行人2，手动修改ROI...

2019-07-31 10:52:26 962 1

原创 Xilinx-SDSoC-FPGA #pragma SDS data access_pattern 指令将BRAM 用作RAM/FIFO 解析

平台：ZCU102开发环境：SDSoC在做PS端与PL端数据通信时，需要通过 #pragma SDS data access_pattern指令来指定FPGA综合生成PL端的硬件接口是RAM还是FIFO;指令语法：#pragma SDS data access_pattern(ArrayName:<pattern> )ArrayName: 传递的参数名&lt...

2019-07-02 13:20:38 918

转载 SDSoC软硬件协同设计—— SDS pragma 指令简介

目录SDS指令简介SDS Pragma组合HLS开发的流程，分成三步，首先在Vivado HLS工具中将C/C++转换成RTL代码并打包成IP核，然后在Vivado IPI中将HLS IP核与Zynq的PS集成在一起，最后在SDK中编写驱动完成整个设计。在这个流程中开发者需要根据应用特点选择合适的接口，合适的DMA，每一次调整都要先在HLS中调整，然后在Vivado更新IP，操作流程十...

2019-06-05 12:28:49 1446

原创【论文解读】 FPGA实现卷积神经网络CNN（二）： Optimizing FPGA-based Accelerator Design for DCNN

博主评论：这篇论文发表在2015年，是一篇FPGA实现CNN的高引用论文，该文从理论与实践结合展示了在FPGA上实现CNN。根据roofline模型分析计算峰值与CTC rate关系，深入探讨了CNN卷积层中的数据依赖关系，进行数据复用从而在内存带宽不变的情况下提升CTC rate，对不同循环分片参数的performance建模，并为每一层卷积选择通用的分片参数来避免复杂的硬件结构。值得一提的是...

2019-06-03 17:57:12 6725 1

转载 YUV格式介绍与转换

YUV格式有两大类：planar和packed。对于planar的YUV格式，先连续存储所有像素点的Y，紧接着存储所有像素点的U，随后是所有像素点的V。对于packed的YUV格式，每个像素点的Y,U,V是连续交*存储的。YUV，分为三个分量，“Y”表示明亮度（Luminance或Luma），也就是灰度值；而“U”和“V” 表示的则是色度（Chrominance或Chroma），作用...

2019-05-21 12:43:59 1514

原创【论文解读】 FPGA实现卷积神经网络CNN（一）： CNP: AN FPGA-BASED PROCESSOR FOR CONVOLUTIONAL NETWORKS

博主评论：目前在移动端部署深度学习推断的需求越来越多，博主认为这类需求属于边缘计算的一部分，目前移动端的主要方式有嵌入式ARM，NPU，FPGA等，然而早在2009年，在卷积神经网络之父Yann LeCun挂名的一篇论文里就提出了使用FPGA实现卷积神经网络推断，考察卷积神经网络并行性，并结合FPGA的高并行计算，对人脸检测达到了每秒十帧的速度，虽然现在网络复杂度变高，但同时FPGA计算能力也在...

2019-05-19 16:57:26 5614

转载更改Ubuntu默认python版本

转自：https://blog.csdn.net/fang_chuan/article/details/60958329当你安装 Debian Linux 时，安装过程有可能同时为你提供多个可用的 Python 版本，因此系统中会存在多个 Python 的可执行二进制文件。一般Ubuntu默认的Python版本都为2.x, 如何改变Python的默认版本呢？下面来一起看看吧。你可以按照以下...

2019-05-08 22:39:19 304

原创 python中的main函数

python是一种解释型脚本语言，和C/C++语言不同，C/C++程序从main函数开始执行，python程序从开始到结尾顺序执行。先总结下python中的main函数的作用：让模块（函数）可以自己单独执行（调试）,相当于构造了调用其它函数的入口，这就类似于C/C++里面的main函数了。一方面：我们想要自己单独执行（调试）这里我们实际调试一下（假设这个文件是test.py）：#t...

2019-04-16 14:31:40 134556 13

原创 yolov3-tiny模型分析（含自己绘制的网络模型图）

最近在实验室做行人检测的项目，希望最后可以做到硬件上面去，所以挑选了yolov3的tiny版本。在实验室专有行人数据集下训练，检测效果还不错，在1080ti上推断速度达到了30fps, 这里和大家一起撸一下yolov3-tiny的网络结构：相比于yolov3, tiny版本将网络压缩了许多，没有使用res层(残差层)，只使用了两个不同尺度的yolo输出层，但总体思路还是可以借鉴yolov3的。...

2019-04-04 22:36:26 33941 199

菜鸟奇遇记