- 博客(17)
- 资源 (4)
- 收藏
- 关注
原创 linux下的一些命令
最近在用linux跑文本程序,操作过几遍总是忘命令,记录一些总忘的:查看conda虚拟环境 :conda-env list
2022-01-14 15:58:50
359
原创 机器学习之逻辑回归
知识点总结,面试点总结笔记:逻辑回归学习笔记,面向找工作笔记-机器学习文档类资源-CSDN下载实现代码链接(以癌症案列为例):机器学习_逻辑回归代码_癌症案例-机器学习文档类资源-CSDN下载...
2021-12-22 17:31:54
807
原创 ValueError: Solver lbfgs supports only ‘l2‘ or ‘none‘ penalties, got l1 penalty.
逻辑回归代码段:model = LogisticRegression(penalty=reg)在进行逻辑回归预测时报错:ValueError: Solver lbfgs supports only 'l2' or 'none' penalties, got l1 penalty.原因:LogisticRegression(C=0.01, class_weight=None, dual=False, fit_intercept=True, int
2021-12-22 15:46:10
5880
原创 python实现学生信息管理系统并打包为.exe文件
项目链接:主界面:录入信息:查找信息:删除学生信息:修改学生信息:排序:统计人数:显示所有人
2021-12-20 22:03:34
748
转载 模型评价指标:ROC AUC
https://blog.csdn.net/liweibin1994/article/details/79462554
2021-12-20 16:28:32
112
原创 上采样、下采样、过采样、欠采样
1. 过采样和欠采样这是两种解决分类训练过程中数据量不平衡的采样方法拿二分类举例,期望阳性样本数量:阴性样本数量 = 1:1,但实际上阳性样本数量:阴性样本数量 = 1000:100过采样将100数据复制10份,达到两个样本数量之比为1000:1000欠采样将1000数据随机抽取100份,达到两个样本数量之比为100:1002. 上采样和下采样卷积神经网络(CNN)是由卷积层/池化层/激活层……组成的“自上而下”的多层网络,原始图像从CNN顶层输入,到底层生成特征图,这个过程
2021-12-20 13:21:14
1850
原创 机器学习之线性回归(boston预测小项目实战)
项目实战代码链接:项目包含从数据产生、分割到运用模型的结果;梯度下降;为何取样的全部代码上传图片皆为学习笔记,供日后复习使用。(包含一些线性回归模型的特点以及特征)代码中包含了扩展特征实现,运行结果能看出线性回归抗冗余抗噪声等特点。代码中还包含了对mse的各种分析。实验效果图:boston预测:普通的线性回归结果:特征添加噪声的回归结果:重复特征的回归结果:特征添加分线性性质回归结果:以上内容原因、结论皆在下图笔记中:...
2021-12-19 19:49:56
676
原创 sklearn使用StratifiedShuffleSplit完成train:test:dev = 6:2:2的数据集分割
import numpy as npfrom sklearn.model_selection import StratifiedShuffleSplitX = []y = []num = 0with open('./bankV4.txt', 'r', encoding='utf8') as v4: old_lines = v4.readlines() print(len(old_lines)) for i in range(len(old_lines)): .
2021-11-27 17:38:13
1150
原创 win7安装latex
一、下载1. 浏览窗口输入:tug.org/texlive2. 点击:available over the Internet3. 点击:Downloading one huge ISO file4. 点击mirror list(如果提示不安全,请点击 高级->继续前往)5.下拉找到China ,选择一个镜像源(以随便一个为例),点击 https (如果提示不安全,请点击 高级->继续前往)6.找到texlive,点击7.点...
2021-10-21 17:06:38
750
原创 Latex可能用到的cmd命令
dir:查看当前目录文件cd,cd ..md创建命令notepad打开记事本certtutil -hashfile texlive版本号.iso 检验下载没有出错
2021-10-21 15:12:22
482
原创 论文阅读——《Online Learning of Rested and Restless Bandits》
请对照原文进行阅读!需要具备bandit基本知识以及马尔可夫链。(可参照reinforcement learning书的第一二三章)摘要 文章研究了一个rested和restless的多player bandit问题。rested和restless的区别在于arm 的state变化,所研究系统主要由一个单一player和K个有限状态马尔可夫链(arms)组成。每个时间步,玩家选择M个arm,M小于等于K。以最大化reward或者最小化regret。restless multi-ar...
2021-09-29 15:31:51
750
原创 word embedding 补充(表面上的秒懂版)
判断一个词的词性,是动词还是名词。用机器学习的思路,我们有一系列样本(x,y),这里 x 是词语,y 是它们的词性,我们要构建 f(x)->y 的映射,但这里的数学模型 f(比如神经网络、SVM)只接受数值型输入,而 NLP 里的词语,是人类的抽象总结,是符号形式的(比如中文、英文、拉丁文等等),所以需要把他们转换成数值形式,或者说——嵌入到一个数学空间里,这种嵌入方式,就叫词嵌入(word embedding)。例如:Word2vec,就是词嵌入( word embedding) 的一种...
2021-09-03 09:23:12
106
转载 embedding
转自:https://www.zhihu.com/question/38002635什么是Embedding?Embedding(嵌入)是拓扑学里面的词,在深度学习领域经常和Manifold(流形)搭配使用。可以用几个例子来说明,比如三维空间的球体是一个二维流形嵌入在三维空间(2D manifold embedded in 3D space)。之所以说他是一个二维流形,是因为球上的任意一个点只需要用一个二维的经纬度来表达就可以了。又比如一个二维空间的旋转矩阵是2x2的矩阵,其实只需要一个..
2021-09-01 17:43:42
848
原创 论文学习笔记(一)——NEURALMACHINETRANSLATIONBYJOINTLYLEARNING TOALIGN ANDTRANSLATE
黑色字体是原文翻译,红色字体是我所做的总结与解释摘要:神经机器翻译是最近提出的机器翻译方法。与传统的统计机器翻译不同,神经机器翻译旨在构建一个可以联合调整以最大化翻译性能的单一神经网络。最近提出的用于神经机器翻译的模型通常属于编码器 - 解码器系列,并将源句子编码为固定长度的向量,解码器从中生成翻译。在本文中,我们推测使用固定长度向量是提高这种基本编码器 - 解码器架构性能的瓶颈,并建议通过允许模型自动(软)搜索部分与预测目标词相关的源句,而不必将这些部分明确地形成为硬段。通过这种新方法,我们在
2021-09-01 16:03:02
346
原创 linux centos7 解压tar.gz
解压命令:tar -zvxf xxxx.tar.gz遇到了一个问题, gzip: stdin: not in gzip format tar: Child returned status 1 tar: Error is not recoverable: exiting now现在我提供一下我总结的解决方法:方法一:#tar -vxfxxxx.tar.gztar包压缩的时候用cvf参数,解压的时候用xvf参数或压缩的时候用czvf参数,解压的时候用xzvf参数...
2021-08-31 10:52:49
20395
原创 linux(centos7)+cuda9.0+cudnn7+tensorflow1.10.0,基于bert的文本分类实战(包含卸载cuda11.x)
最近在做文本分类。虽然bert已经过时了,但还是拿来用一用试试,由于是linux新手,在cuda上走了不少弯路(可以直接搭建虚拟环境安装cuda9.0,不用卸载11.x),现将完整过程写在这里:1.卸载cuda11再安装cuda11没有unistall文件,暴力卸载大法好。sudo rm -rf /usr/local/cuda-11.4sudo rm -rf /usr/local/cuda-11sudo rm -rf /usr/local/cuda这里强烈建议大家去/usr/l...
2021-08-30 15:47:36
424
1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人