- 博客(53)
- 资源 (2)
- 收藏
- 关注
原创 R语言read.csv万能读取各种文件编码的方式
使用R语言读取csv文件的时候,由于文件的字符集不同,有时往往会有乱码。最近整理一个读取csv的方式,足以应付99%的情况。
2023-04-06 16:15:46
1279
1
原创 pycharm PyQt5 designer pyuic pyrcc 设置
PyQt5Designer欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入python3.9pycharmpip install PyQt5pip install PyQt5-too
2022-02-15 17:25:51
1123
原创 R语言data.frame label的设置
假设dataframe为df <- data.frame(age = c(20, 30, 40), sex = factor(c(1, 2, 1), labels = c("男", "女")) )使用attr设定label属性attr(df[["age"]], "label") <- "年龄"attr(df[["sex"]], "label") <- "性别"也可以使用attr查看label att
2021-10-22 12:01:29
4950
1
原创 R语言data.frame的Encoding(中文乱码解决方式)
查看data.frame的列的字符编码方式使用Encoding函数查看:df %>% select_if(is.character) %>% # 选择是character的列 map(Encoding) %>% # 显示该列的encoding as.data.frame # list整理成表更进一步,采用stringi package的stri_enc_mark函数获取encoding方式librar
2021-10-19 15:48:48
5169
原创 windows获得文件hash值的方式
powershellget-filehash file.csv -algorithm SHA512 | format-listAlgorithm: SHA1 | SHA256 | SHA384 | SHA512 | MACTripleDES | MD5 | RIPEMD160cmdcertutil -hashfile file.csv SHA512Algorithm: MD2 MD4 MD5 SHA1 SHA256 SHA384 SHA512
2021-06-07 12:40:24
607
原创 R语言字符串日期转换和本地设置
使用R语言的as.Date进行日期转换时,需要注意本地设置(locale setting),否则有可能转换失败。> as.Date("01jul2020", format = "%d%b%Y")[1] NA> lc <- Sys.getlocale("LC_TIME") # get the LC_TIME and save it> Sys.setlocale("LC_TIME", "C") # set to C lang default[1] "C">
2021-05-07 09:22:48
968
原创 R语言服务器环境安装全局package
一般个人电脑上安装R的package使用命令install.packages()就可以了,默认安装在个人的home目录下(Windows/Linux)。有时需要在服务器环境安装每个登录账号都能使用的package,该如何做呢?1. 查看当前的package查找路径# Search Paths for Packages> .libPaths()[1] "C:/Users/myhome/Documents/R/win-library/4.0" "C:/Program Files/R/R-4.0.3
2021-05-06 10:55:28
431
原创 R语言命令行执行代码的3种方式(传递参数和环境变量)
大部分情况在IDE环境中运行R程序,但有时也需要在shell中运行,想其他语言的脚本一样。在shell中如何运行R语言的代码呢?为了简化使用,把R/Rscript的可执行路径加入path环境变量。(bash,windows cmd)使用R首先看看R的helpc:\R> R --arch x64 --helpUsage: Rterm [options] [< infile] [> outfile] [EnvVars]Start R, a system for statist
2021-04-21 09:50:31
13255
原创 AWS Redhat Enterprise Server安装桌面步骤
安装EPELEPEL(http://fedoraproject.org/wiki/EPEL) 的全称叫 Extra Packages for Enterprise Linux 。EPEL是由 Fedora 社区打造,为 RHEL 及衍生发行版如 CentOS、Scientific Linux 等提供高质量软件包的项目。装上了 EPEL之后,就相当于添加了一个第三方源。和rpmfusion.org的相比较的话,rpmfusion 主要为桌面发行版提供大量rpm包,而EPEL则为服务器版本提供大量的rpm包
2021-03-10 11:12:53
331
原创 Bioconductor设置清华大学的镜像
在Home目录下增加/修改.Rprofile文件,在文件最后加上镜像设置:options(BioC_mirror="https://mirrors.tuna.tsinghua.edu.cn/bioconductor")再次打开RhuoRStudio即可生效。
2021-03-10 08:34:42
3277
原创 Shiny server的app目录映射规则
shiny sever配置成site host模式之后,在site根目录下可以deploy多个app,每个app一个目录。+---/srv/shiny-server| +---shinyApp1| +---server.R| +---ui.R| +---shinyApp2| +---app.R| +---www| +--- a.html| +---assets| +---style.css|
2020-07-14 22:44:42
1414
原创 R Shiny App增加对百度统计的支持
方法很简单,在百度统计的代码存放在一个js文件中,比如baidu_stat.js,var _hmt = _hmt || [];(function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?XXXXXXXXXXXXXXXXX"; var s = document.getElementsByTagName("script")[0]; s.parentNode.ins
2020-07-05 17:51:27
267
2
原创 缺失值的插值处理
缺失值根据情况可以删除对应的行或者列,但是在需要尽量保持原始数据的情况下,可以使用插值的方式进行处理。使用mean/median/mode数进行插值library(Hmisc)impute(vector_data, mean)impute(vector_data, median)impute(vector_data, 100) # 直接赋值# 不使用函数vector_data[is.na(vector_data)] <- mean(vector_data, na.rm = T)
2020-06-23 23:23:06
1564
原创 多重检验的p值校正:FWER和FDR
先回忆一下假设检验的来两类错误(参考:深入理解假设检验的两类错误和功效):对于多重检验来说,假设做了m次test,V是假阳性的次数,S是真阳性的次数,R是V+S。 列表如下:H0H_0H0 Do not reject H0H_0H0 Reject H0H_0H0TotalTRUEU V m0m_0m0FALSE TSm−m0m-m_0m−m0Totalm-RR mFWER: Family-wise error rateFWE
2020-06-23 22:50:15
8421
原创 R语言如何删除数据集中指定的行或列?
按索引删除只是最基本的删除方式,比如:删除第1到10行:df[-c(1:10),]删除第5到10列:df[,-c(5:10)]按名字删除无论行列,可以找出对应索引或构造相同长度TRUE/FALSE的向量,把不需要的行/列删除index-which(colnames(df) %in% c("a","b"))-grep("a|b",colnames(df)T/F vector!colnames(df) %in% c("z","u")!grepl("a|b", colnames
2020-06-06 21:50:04
135812
1
原创 R语言自动设置当前文件的路径为工作路径
在R文件的前面添加一行语句:setwd(dirname(parent.frame(2)$filename))这样,每次点击RStudio的Source按钮的时候,都会自动setwd到当前执行文件的路径。注意:需要Source该R文件才有效,在RStudio中run the current line没有效果。另:SAS程序自动设置当前执行文件的工作路径:https://blog.csdn.net/ofoliao/article/details/99574853...
2020-05-29 21:19:55
3148
原创 R语言read.csv乱码问题UTF-8 BOM X.U.FEFF
若使用R语言调用data <- read.csv("dataset.csv")文件出现了乱码,解决的方法简单整理如下:查看R语言运行环境的区域(locale)设置> Sys.getlocale(category = "LC_ALL")[1] "LC_COLLATE=Chinese (Simplified)_China.936;LC_CTYPE=Chinese (Simplified)_China.936;LC_MONETARY=Chinese (Simplified)_China.93
2020-05-29 19:25:52
16353
1
原创 R语言如何删除数据集中包含缺失数据NA的行?
请看stackoverflow大神们的花样操作:https://stackoverflow.com/questions/4862178/remove-rows-with-all-or-some-nas-missing-values-in-data-frame
2020-05-04 11:02:48
58614
原创 RStudio效率提升快捷键
快捷键功能alt -快速输入赋值符合 <-ctrl ↑在console快速调出历史输入命令。若输入了前缀,则过滤出带前缀的命令。alt shift K调出快捷键快速参考...
2020-02-19 07:44:24
414
原创 R语言统计基础函数备忘
记录一下R语言常用的基础函数,备忘。持续更新描述性分析函数说明table()计算频数margin.table()计算边沿频数prop.table()计算相对频率,频数比例cut()用于连续数据分组max(),which.max()最大值,最大值的下标mean(), weight.mean()均值,加权平均数概率模拟函...
2020-01-12 10:41:12
650
原创 R语言ggplot2要素总结
ggplot2基础定义数据(data),创建空图(plot object)。ggplot()指定几何图形(geoms – graphics shapes)展现数据。geom_xxxx()指定几何图形的特征(aesthetics – features)表现数值。aes()表示增加图的组件(或图层)geom & aes常用geom以及aes如下表,许多geom还是有colo...
2019-12-30 23:42:00
972
原创 R语言base graphics绘图设置
绘图区域(plotting regions)inner region = figure regiondata symbols and lines -> plot regionaxes and labels -> figure margins or outer marginsThe size and location of the different regions: ...
2019-12-30 23:39:25
1407
原创 R语言base graphics: low level绘图函数
FunctionDescriptionpoints()Draw data symbols at locations (x, y)lines()Draw lines between locations (x, y)segments()Draw line segments between (x0, y0) and (x1, y1)arrows()Draw ...
2019-12-30 23:37:03
521
原创 R语言base graphics: high level绘图函数
R语言base graphics: high level绘图函数单变量high level绘图函数两个变量high level绘图函数多变量high level绘图函数特定图形绘图函数 Specialized plots本文是R Graphics的笔记。R语言base graphics绘制图形的方式:首先使用high level绘图函数参数产生一个新的图形,然后使用low level绘图函数添...
2019-12-28 19:36:24
654
原创 R语言元编程metaprogramming基础函数
R语言元编程基础函数substitute替换函数。形式substitute(expr, env),表达式expr中的变量使用env中的绑定的变量的值(若是函数参数,可能因为promise的缘故还没有eval)替换,env不进行回溯,只在当前的env中搜索。而且env不能是.GlobalEnv,如果是.GlobalEnv,不进行替换。env可以是list。A promise捕获(captur...
2019-12-10 11:39:49
985
原创 R语言面向对象之R6 class
R语言面向对象之R6 class类定义class declaration对象创建object creation对象初始化和终结处理object initialization and finalizer对象打印输出print对象克隆clone类动态修改继承Inheritance访问控制 controlling access(本文是AdvancedR的R6章节的整理)R6是R语言和现在OOP语言比...
2019-12-05 18:55:18
4103
原创 分位数与QQ图
QQ图基本知识Sample Quantiles 样本分位数quantile(x, ...)给定一个系列xxx,可以求出给定累积概率ppp对应的分位数。计算分位数有9种方法1^11:假设方法iii(1≤i≤91 \le i \le 91≤i≤9),对应概率p的计算公式是:Q(p)=(1−γ) xj+γ xj+1,Q(p) = (1 - \gamma)\ x_j + ...
2019-12-04 17:54:35
2518
原创 CDISC标准介绍
CDISC(Clinical Data Interchange Standards Consortium)临床数据交换标准协会就如何收集数据、收集什么类型的数据以及如何将数据提交给负责审批新药的机构建立起了一套标准。涉及临床研究电子数据的获取、交换、存档、提交的全过程。下表是CDISC的细分标准[1]:StandardDescriptionStudy Data Tabulat...
2019-11-26 13:12:41
16086
4
原创 SAS数据步过程步边界
Step BoundarySAS编程中,当跨过step boundary时,提交的代码会被触发执行。那么SAS的step boundary有哪些?有:DATA statementPROC statementQUIT statementRUN statementThe single semicolon ; statement following a DATALINES statemen...
2019-11-24 10:31:06
790
原创 深入理解假设检验的两类错误和功效
进行假设检验时,由于数据的随机性,所作出的决策可能会有:第 I 类错误(拒真):H0H_0H0为真时错误地拒绝了零假设。第 III 类错误的最大概率记为 α\alphaα。第 II 类错误(受伪):H0H_0H0为假时错误地没有拒绝零假设。第 IIIIII 类错误的最大概率记为 β\betaβ。H0H_0H0Do not reject H0H_0H0Reject H0H_...
2019-11-18 13:19:41
2447
原创 R语言面向对象之S3 class
S3类是R语言中最基础的类设计,是居于object+attribute的方式构造的。构造方法代码一步构造o1 <- structure(data, class = "ClassA")显式设置o1 <- data; class(o1) <- "ClassA" 和类相关的几个函数: typeof(obj) attribute...
2019-11-16 20:25:57
1431
原创 Bootstrap重抽样方法
Bootstrap重抽样方法非参数重抽样 Non-parametric resampling此方法不假设数据的分布或模型。数据表示为n个独立观测向量yobsy_{obs}yobs, 假设求参数的参数θ^(yobs)\hat{\theta}(y_{obs})θ^(yobs)的置信区间,非参数bootstrap抽样的步骤如下:从yobsy_{obs}yobs中不放回的重抽样nnn次,得到...
2019-11-10 18:35:47
12433
原创 Bootstrap词的起源
在计算机学和统计学科中,经常可以看见Bootstrap这个词。此外,还有动名词的形式Bootstrappping,在计算机学科中简写成Booting。Bootstrap这个单词本意是靴子的鞋带。在19世纪早期美国的出现一个短语,“pull oneself over a fence by one’s bootstraps”,意思是“通过拉自己的靴子上的鞋带,把自己提起来越过栅栏”,起初是指荒谬的不...
2019-11-01 20:49:19
1718
原创 R语言绘制叠加图形
使用R语言我们比较常用的在幅图上绘制多个图形,使用par(mfrow)layout()就能够在一幅图上绘制(排列)多个图形。比如:DoseFinding包中的biom数据,我们在一幅图上输出biom数据集的箱线图和散点图:(先install.packages("DoseFinding"))library(DoseFinding)data(biom)par(mfrow = c(1...
2019-10-29 20:19:10
12585
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人