- 博客(20)
- 收藏
- 关注
原创 关于大模型领域迁移相关工作的记录
最近做了一些大模型方面的研究 ,资料、开源模型源源不断,特此记录及近况更新,关于llama、bloom、glm等
2023-04-13 19:28:31
1209
原创 Rouge | 自动文摘及机器翻译评价指标
实例展示自动文摘及机器翻译等任务的评价指标rouge的计算,包括rouge-1、rouge-2、rouge-L
2023-02-23 14:42:33
1041
原创 EXCEL处理|pandas使用方法记录
excel操作读取excel读取csv,excel文件,选择其中某些列,重命名列名,合并两个excelformer_file_path1 = "信息.csv"former_file_path2 = "信息2.csv"former_data1 = pd.read_csv(former_file_path1,usecols=["F015V_0007","标题","公告日期","公告地址","OB_ORGID_0045","代码"],encoding="utf-8")former_data2=pd.r
2022-05-25 14:44:33
434
原创 零散问题记录
1.argparse模块('--version_2_with_negative', action='store_true'的默认值是False,需要在传参时传入--version_2_with_negative才是trueimport argparseparser = argparse.ArgumentParser()parser.add_argument('--version_2_with_negative', action='store_true', h
2021-12-28 16:08:52
1077
原创 python连接池pooledDB源码阅读参数详解
pooledDB参数详解from DBUtils.PooledDB import PooledDBself.__pool = PooledDB(creator=pymysql, mincached=1, maxcached=4, # 连接池中最大空闲连接数 maxconnections=4,#允许的最大连接数 blo
2021-06-02 09:29:48
3664
3
原创 python中的多线程
python中的多线程文章目录python中的多线程先来试试线程退出条件方法属性Threading属性Thread实例的属性run和start方法单线程情况多线程情况全局解释器锁GIL(Global Interpreter Lock)参考多线程是操作系统能够进行运算调度的最小单位,它被包含在进程之中,是进程中的实际运作单位。一个进程必须包含一个线程。在线程中,所有状态在默认情况下都是共享的,比如内存共享。先来试试python标准库包括:低级模块_thread 和高级模块 threading,绝大多
2021-04-13 17:01:58
532
原创 docker及k8s常用操作命令
1.安装docker#在centos7上有网的情况下,只需要一条命令:yum install docker#docker命令的时候可能出现:Cannot connect to the Docker daemon at unix:///var/run/docker.sock. Is the docker daemon running?#再使用一条命令:systemctl start docker2. 镜像操作常用命令# 注:tensorflow:1.0.0为镜像名,也可以换做镜像id# t
2021-02-09 16:28:25
954
原创 git出现文件夹后面跟@+数字
一、问题git push后出现文件夹后面跟@+数字,是因为出现了子模块。@后面的数字是哈希值,用于确定唯一的提交状态。文件push时会压缩,然后上传同时生成一串检验字符串,at后面的数字就是检验字符串的前面部分。二、原因文件夹内还有.git,导致这些文件夹push后变成了子模块三、解决思路删除原来的子文件夹的.git删除本地git缓存重新add,push四、解决方法之不变成子模块rm -r .git# .代表当前文件夹内所有内容git rm -r --cached .git add
2020-08-18 20:26:49
7611
原创 使用busuanzi统计hexo博客访问量
网站的访问量和访问人数在themes/chic/layout/_partial/footer.ejs中加入# |和visits可以任意改,不改代码即可<span id="busuanzi_container_site_pv"><span id="busuanzi_value_site_pv"></span> visits | </span>...
2020-01-06 20:47:31
1468
原创 jupyter notebook中使用tensorflow虚拟环境
jupyter notebook中使用tensorflow虚拟环境创建一个虚拟环境,专供tensorflow使用使用jupyter notebook遇到的问题尝试过程参考资源后话以为很简单的只是conda install 就可以的事,折腾了一整天的环境问题。步骤经过大概是创建一个虚拟环境,专供tensorflow使用创建虚拟环境的原因干净独立的环境不受其它影响听说tensorflow...
2019-11-15 14:17:01
3762
2
原创 贝叶斯公式/朴素贝叶斯分类器及python自实现
本文从贝叶斯与频率概率的对比入手理解贝叶斯决策的思维方式。通过两个实例理解贝叶斯的思想与流程,然后梳理了朴素贝叶斯分类器的算法流程,最后从零开始实现了朴素分类器的算法。文章目录1.起源、提出与贝叶斯公式2.以实例感受贝叶斯决策:癌症病人计算 问题3.以实例感受贝叶斯修正先验概率:狼来了4.朴素贝叶斯分类器5.代码实现1.数据集载入,划分训练集与测试集2.计算先验概率3.计算类条件概率4.先验概率...
2018-11-20 21:26:44
24580
18
原创 决策树
说在前头:本文的语句大部分出于自己理解的白话文,可能并不标准,但力求简单易懂。1.决策树简要介绍1.1决策树是什么决策树是基于树结构的决策模型,对一个问题形如“这是好瓜吗?”进行决策的时候,通过一系列的“子决策”(通过各个属性特征)来进行分支判断,决策过程的最终结果对应了判定结果。决策树的叶子节点所代表的类别即是当前测试样本的预测类别。决策树的学习目的:产生一颗泛化能力强的决策树。...
2018-10-29 00:21:27
427
原创 从尾到头打印链表 python
题目描述输入一个链表,按链表值从尾到头的顺序返回一个ArrayList。# -*- coding:utf-8 -*-# class ListNode:# def __init__(self, x):# self.val = x# self.next = Noneclass Solution: # 返回从尾部到头部的列表值序列,例如[1...
2018-09-23 11:11:32
446
原创 CNN的经典文章要点总结
AlexNet(2012)1.ReLU Nonlinearity2.Training on Multiple GPUs3 Local Response Normalization4 overlapping pooling5.减少过拟合5.1 data augmentation5.2 dropout(1-x)6.训练设置7.结果VGG16/19(2014)1.小尺...
2018-07-18 14:18:59
4177
1
原创 图片输入大小问题-keras/PIL.Image
之前在做keras训练任务的时候都没有考虑过图像数据的输入大小问题,但在实验中发现这也是一个容易陷坑的问题。1.keras封装好的模型,当include_top=False时,迁移权重训练,图像的输入也不用必须是默认的尺寸。可以是比默认尺寸大的任意尺寸,比默认尺寸小的话,就要考虑够不够计算一系列的卷积池化操作了。权重保存的是卷积“核”的权重,只要卷积核的大小数目不变,即网络模型不变,就可...
2018-07-04 14:47:35
16445
5
原创 matconvnet环境下训练自己的数据集及模型测试-mnist网络结构-cifar10部分数据集
摘要网络结构:mnist的LeNet结构数据集:cifar10中的batch1和batch2准确率:测试集测试51.37%我将下载好的cifar-10数据可视化为图片后,这样就可以假装是自己的数据集了,毕竟以后任何的图片数据集我都会操作了。将batch1和batch2做成和mnist的mat数据结构一样的mat结构(其实就是依样画葫芦,mnist怎么存储的我就怎么存储的,保持所有格式一致),
2017-10-27 15:17:27
1401
原创 Java学习笔记-循环
注:本系列是跟着中国Mooc上浙江大学翁恺老师的零基础学java视频学习的第三周作业1:奇偶个数题目内容: 你的程序要读入一系列正整数数据,输入-1表示输入结束,-1本身不是输入的数据。程序输出读到的数据中的奇数和偶数的个数。输入格式: 一系列正整数,整数的范围是(0,100000)。如果输入-1则表示输入结束。输出格式: 两个整数,第一个整数表示读入数据中的奇数的个数,第二个整数表示读
2017-10-21 21:50:40
367
原创 CIFAR10数据集 matlab可视化及理解
CIFAR10数据集共有matlab、python、及C语言三种类型的数据集,我下载的是matlab版本,下载完之后显示的是矩阵集合形式而非图片的形式,在网络上搜寻方法并理解代码如下:load(['yourpath']);for i = 1:size(data,1); p = data(i,:); label = labels(i); %数据是以一行的形式存在,每一行都是一张
2017-10-08 19:59:29
3946
4
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人