- 博客(45)
- 资源 (1)
- 收藏
- 关注
原创 Git:科学写作中的版本控制Version control in Scientific writing
概述此部分讨论科学写作中的版本控制问题。思路除非涉及到极大的文件 (~GB),否则所有科学写作材料均放在同一个文件夹中 (pack and go)在任意时刻,同一文件仅有一个版本在文件夹中节省存储空间避免出现名字冗长而根本不知所云的文件副本牢记版本控制的基本单位是文件群,而不是单个文件将文件夹作为版本库,使用版本控制工具进行管理通过切换文件夹版本,实现切换文件版本的任务流程下载安装Git打开Git Bash设置科学写作文件夹为工作区使用pwd、cd、ls命令跳转到目
2022-01-16 11:36:08
421
原创 Git:撤销文件修改,文件误删与文件恢复
撤销文件修改git checkout -- <file>:版本内撤销文件修改分3种情况讨论文件目前仅在工作区,不在暂存区,该命令将使文件退回目前HEAD指针指向的版本对应的文件状态文件已通过git add <file>添加到暂存区,该命令将使文件退回其刚刚添加到暂存区后的状态若文件已通过git commit -m <message>提交为一个版本,则必须通过git reset --hard <commit id>[[Git学习笔记#版本回退|回退
2021-07-08 17:25:51
3122
原创 Git:日志与版本检查,标签,版本回退
检查日志及不同版本快照git log:检查版本库日志,每一条形如下;按Q可退出commit <commit id> (HEAD->master)Author: <name> <email>Date: <time> <message> commit <commit id>Author: <name> <email>Date: <time> <m
2021-07-06 14:55:46
360
原创 Git:基本概念,安装与提交文件
安装Git安装:从官方网站上下载安装,使用默认选项即可设置此机器的用户名和邮箱$ git config --global user.name "Your Name"$ git config --global user.email "email@example.com"创建版本库创建版本库所在文件夹选择合适的地址创建一个文件夹作为版本库语法和Linux一样,mkdir是新建文件夹,cd是进入特定文件夹,pwd是呈现当前地址,ls是列举当前文件夹下所有对象,不赘述Git仓库 (
2021-07-06 14:54:55
172
原创 R语言笔记-帮助文档-ggplot函数
文章目录描述基本语法``data````mapping````environment``细节描述该函数定义了一个ggplot对象。包含两层基本内容:源数据源数据中各项指标到图形特征的映射 (美学元素aesthetics)在ggplot中定义的美学元素将会应用于后续所有叠加于其上的图层中,除非图层中特别声明并进行覆盖基本语法ggplot( data=NULL, mapping=aes(), ..., environment=parent.frame() )data声明了
2021-01-18 18:33:59
3285
原创 R语言笔记-ggplot2-用于计数的条形图
文章目录基础条形图:``geom_bar``条形高度表示计数:``stat="count"``条形高度表示特定函数值:``stat="identity"``复合条形图堆叠计数条形图:``fill=堆叠分类变量``分立计数条形图:``position="dodge"``堆叠比例条形图:``position="fill"``基础条形图:geom_bar条形高度表示计数:stat="count"geom_bar()的参数stat声明了条形高度的含义。stat="count",高度表示计数,默认配置,无需特
2021-01-15 16:26:21
6870
2
原创 R语言笔记-日期和时间数据
文章目录日期和时间类POSIXct和POSIXlt类Date类日期和字符串的相互转换字符串转为日期:``strptime()``日期的格式化:``strftime()``日期和时间数据的运算加数值求两个日期/时间之间的差值:``difftime()``生成规律时间序列:``seq()``日期和时间类POSIXct和POSIXlt类POSIXct:存储了以世界标准时 (UTC)为准的从1970年开始计时的秒数计数返回当前日期和时间:Sys.time()POSIXct:适用于存储和计算时间POSI
2021-01-13 21:22:57
1121
原创 R语言笔记-ggplot2-散点图和拟合曲线图
文章目录概述散点图:``geom_point()``简单散点图带分组的散点图声明≥3个连续变量特征的散点图拟合曲线图:``geom_smooth()``同时呈现分组散点图与整体拟合图:``stat_smooth()``根据分类变量取值分别作图:``facet_grid()``概述ggplot函数data:定义待可视化的源数据mapping:定义数据到图形的映射aes:美学元素,定义图形的呈现细节geom开头的一系列函数:指定图形元素主题 (theme):主题提供了一套绘图风格,在
2021-01-13 20:22:39
39053
5
原创 postgreSQL笔记-语句速查 (自用)
文章目录说明参考材料数据库、表格、数据的建立、删除、修改数据库表格行 (数据/个案)列 (字段)索引约束个案选取:``SELECT``多表查询:``JOIN``视图:``VIEW``日期和时间数据空值:``NULL``说明从大型数据库提取数据并进行分析是非常具体的工作。考虑到同时进行的临床及其他科研工作的繁重性,顺序遍历教程 (即便入门教程)并手打、测试所有代码,既无必要,也耗时间。因此建立该速查,仅用于极为扼要地记录语句用途、应用时的重要说明。参考材料W3school sql教程数据库、表格
2020-12-25 16:36:33
209
2
原创 postgreSQL笔记-约束
文章目录概述``NOT NULL``概述约束 (constraints):对加入表的数据特征的某些限定。约束既可以在创建数据表时声明 (CREATE TABLE),也可在创建之后予以声明 (ALTER TABLE)。NOT NULL代表该字段不接受空值。如果不对该字段赋值,则无法插入/更新记录。...
2020-12-15 23:36:31
1169
原创 postgreSQL笔记-创建数据库,创建表格,插入、更改与删除数据
文章目录创建数据库:``CREATE DATABASE``创建数据表:``CREATE TABLE``数据类型插入数据:``INSERT ... INTO``示例更改数据:``UPDATE``删除数据删除符合特定条件数据:``DELETE FROM ... WHERE ...``清空表格内容:``DELETE * FROM ...``创建数据库:CREATE DATABASE语法:CREATE DATABASE 数据库名;创建数据表:CREATE TABLE语法:CREATE TABLE 数据表名
2020-12-15 18:07:36
516
原创 postgreSQL笔记-JOIN
文章目录概述提取交集:``INNER JOIN``其他几种提取方式对``LEFT/RIGHT JOIN``的理解概述JOIN语句用于从不同表中通过公共的列提取数据。将该特殊的公共列称为公共键。提取交集:INNER JOIN表1 INNER JOIN 表2:代表提取表1、表2中公共键均有取值的所有个案。语法:SELECT表1.欲提取的列1,表1.欲提取的列2,...表2.欲提取的列1,表2.欲提取的列2,...FROM 表1INNER JOIN 表2ON 表1.公共键名=表2.公共键名
2020-12-15 16:39:34
630
原创 postgreSQL笔记-SELECT
文章目录选取所有内容选取特定列选取所有内容SELECT * FROM 表名选取特定列SELECT 列名 FROM 表名如果存在多个列,列之间以,隔开。
2020-12-01 09:56:10
437
1
原创 MIMIC探索-抽取患者的处方信息
文章目录``prescriptions``表介绍prescriptions表介绍该表涵盖了患者住院、住ICU期间处方的信息。重要字段有:row_id, subject_id, hadm_id, icustay_id:标识符,分别为行标识、患者标识、住院标识、住ICU标识startdate, enddate:开始和结束使用药物的时间drug_type, drug:药物类型和药物名称...
2020-11-02 23:07:10
1229
原创 NACCTBI数据分析日志:2020-10-27
将3个sheet进行重命名:clin, T1, ACBRT1$has_clinical<-在T1中反查是否有clin中的NACCID,是1否0 =IF(COUNTIF(TBI_clinical_data!$A$2:$A$1428,A2)>0,1,0) T1中819行均为1T1$MRI_name_2<-将MRI_name中的.zip去掉 =LEFT(C2,LEN(C2)-4) 如此与ACBR*中名称保持一致便于检索ACBR*$has_T1<-在ACBR*中反查是否有
2020-10-27 21:41:52
148
原创 R语言笔记-变量间相关性评价
文章目录连续变量间相关性计算Pearson、Spearman、Kendall相关系数:``cor(,method="")``相关系数的假设检验与置信区间检验一个相关系数:``cor.test()``检验相关矩阵下的所有相关系数:``corr.test()``偏相关:``pcor()``与``pcor.test()``分类变量间相关性独立分类变量相关性:``assocstats()``配对列联表相关性 (一致性):``kap()``示例数据:MASS包中的birthwt数据集。首先将数据集中的分类变量因子
2020-10-23 23:23:08
5297
1
原创 R语言笔记-用tableStack汇总双变量分析结果
文章目录预处理``tableStack()``用法以紧凑形式呈现:``name.test=FALSE``呈现所有变量的基本信息:``by="none"``呈现多分类变量水平下的结果将输出结果导出到csv文件示例数据:MASS包中的birthwt数据集。预处理将分类变量因子化,具体参考这里为每个变量设置标签:语法为attr(数据框名,"var.labels")<-c(按变量顺序排列的标签名)> attr(birthwt,"var.labels")<-c("low birth w
2020-10-22 22:25:29
2200
1
原创 R语言笔记-连续型变量组间差异比较
文章目录独立样本t检验方差齐性检验 (两组):``var.test()``独立样本t检验:``t.test()``非独立样本t检验单因素方差分析 (ANOVA)正态性检验:``tapply(,shapiro.test)``方差齐性检验 (多组)Bartlett检验:``bartlett.test()``Levene检验:``leveneTest()``建立单因素ANOVA模型:``aov()``事后检验TukeyHSD检验:``TukeyHSD()``其他校正方法:``pairwise.t.test()``
2020-10-22 21:50:31
8564
原创 R语言笔记-分类变量列联表和独立性检验
文章目录频数表与列联表的生成一维频数表二维列联表多维列联表独立性检验χ2\chi^2χ2检验相对危险度 (relative risk, RR)与比值比 (odds ratio, OR)分层情形下的独立性检验:Mantel-Haenszel检验配对列联表的一致性检验:McNemar检验示例数据:MASS包中的birthwt数据集。首先将数据集中的分类变量因子化,具体参考这里。频数表与列联表的生成一维频数表仅展现1个分类变量频数统计语法:table(数据框名$变量名)> table(bi
2020-10-21 22:06:46
11751
原创 R语言笔记-数值型变量的描述统计
文章目录不分亚组的描述统计使用向量操作计算单个变量的描述统计量计算汇总了多个变量的数据框的描述统计量:``sapply()````psych``包:``describe()``分亚组的描述统计``aggregate()````epiDisplay``包:``summ()````psych``包:``describeBy()``不分亚组的描述统计以MASS包中的数据集birthwt为示例。使用向量操作计算单个变量的描述统计量单个变量统计函数计算的基本语法:统计函数(数据框$变量名)关于基本统计函数
2020-10-21 16:55:11
3784
原创 R语言笔记-数据集信息概览
文章目录检查基本信息:``str()``将分类变量因子化:``factor()``对有序分类变量的声明:``ordered=TRUE``变量信息汇总统计基本包:``summary()````epiDisplay``包:``des()````epiDisplay``包:``summ()``以MASS包中的数据集birthwt为示例。检查基本信息:str()留意变量类型:分类变量 (是否因子化),数值变量。data(birthwt,package = “MASS”)str(birthwt)‘dat
2020-10-21 16:24:42
2653
原创 R语言笔记-缺失值的处理
文章目录缺失值的识别缺失值的忽略在计算中忽略缺失值:``na.rm=TRUE``删除变量存在缺失值的个案:``na.omit()``缺失值的识别缺失值表示:NA,代表not availableis.na():返回与输入对象相同格式的对象,其中元素为逻辑值,若原对象该位置为缺失值,返回TRUE,否则返回FALSEtable(is.na()):返回输入对象缺失值与有效值的统计举例如下:> M ID sex age score1 1 1 15 802 2 2 N
2020-10-19 22:07:09
7490
1
原创 MIMIC探索-抽取颅脑损伤患者信息
文章目录颅脑损伤ICD9编码对开放/闭合以及合并颅内损伤的声明对意识障碍的声明FRACTURE OF SKULL (800-804)800 Fracture of vault of skull801 Fracture of base of skull802 Fracture of face bones803 Other and unqualified skull fractures804 Multiple fractures involving skull or face with other bonesI
2020-10-19 10:50:55
939
原创 文献计量学-使用HistCite执行引文分析 (Citation Analysis)
文章目录概述下载与安装文献检索与导入文献列表基本信息引文分析重要指标上层字段指标单篇文献指标寻找开创性文献寻找初始检索后的漏网文献文献选取与标记导出至Endnote新领域引文分析标准流程参考材料概述文献信息分析基于引文的分析 e.g. HistCite基于内容的分析 e.g. refviz,omniviz,Tda分析前沿 e.g. CitespaceHistCite (history of citations):强大的引文分析工具,可使用图谱方式展现某领域不同文献之间的关系;可快速绘
2020-10-19 00:35:56
3188
1
原创 R语言笔记-数据框长宽格式转换
文章目录长格式与宽格式整洁数据集的要求使用基本包进行转换:``reshape()``长转宽宽转长使用``tidyr``包进行转换长转宽:``pivot_wider()``宽转长:``pivot_longer()``长格式与宽格式长格式 (long form):一行代表一次观测,对一个对象不同时刻的观测分布在不同的行之中例如,共有m个对象,每个对象都在n个不同的时刻进行观测,共产生的mn个观测值以长格式记录如下subjecttimepointvalue111t1t_1
2020-10-18 23:52:53
5479
原创 R语言笔记-数据框的合并
文章目录合并个案:``rbind()``合并变量:``cbind()``按标识符合并一般数据合并``merge()``和``full_join()``指定供受体数据框的数据合并:``left_join()``和``right_join()``合并个案:rbind()rbind(数据框1,数据框2):合并数据框1、2的所有行要求合并的数据框必须有相同的变量常用于合并个案合并变量:cbind()cbind(数据框1,数据框2):合并数据框1、2的所有列要求合并的数据框必须有相同的个案常用于
2020-10-18 23:03:20
25017
原创 R语言笔记-用dplyr包处理数据框
文章目录安装``dplyr``包筛选个案:``filter()``和``slice()````filter()````slice()``排列个案:``arrange()``选择特定变量构成新的数据框:``select``增加变量与更新变量:``mutate``增加变量 (计算为新变量)更新变量 (计算并覆盖)计算统计量:``summarise``拆分数据框:``group_by()``传递符:``%>%``将``group_by()``和``summarise()``结合在一起实现分组统计安装dpl
2020-10-18 22:27:30
780
原创 R语言笔记-用基本包处理数据框
查看数据框内容函数解释head()显示数据集前几行tail()显示数据集后几行str()数据集概览attributes()更详细的数据集信息查看des()数据集中变量基本信息查看以epiDisplay包下的Familydata数据集为例:> library(epiDisplay)> data("Familydata")直接输入数据框名称:等价于使用print()函数对于比较大的数据框,会占用很多屏幕head(som
2020-10-18 00:04:09
1343
原创 R语言笔记-获取、导入与导出数据
从内置数据集获取数据内置数据集存在于各个包中基本包datasets中包含各个领域的100多个数据集,可使用data()函数进行查看data(package="datasets")调用数据集到工作空间:data(数据集名称)查看数据集的帮助:help(数据集名称)调用不在内存之中包的数据集时,需要先加载该包到内存之中# e.g.> library(MASS)> data(package="MASS")> data(bacteria)> bacteria模拟
2020-10-17 21:41:55
3312
1
原创 R语言笔记-R的数据结构:向量,因子,矩阵,数组,列表,数据框,数据类型转换
向量 (vector)用于存储数值型、字符型、逻辑型数据的一维数组。建立向量枚举A<-c(1,2,3,4,5)数值序列A<-seq(from=1,to=10,by=2) # 以2为步长,从1起始到10结束同值重复A<-rep("HUAWEI",times=5) # "HUAWEI"重复5次选取向量元素/子集单个元素A[k] # 选取向量A中第k个元素选取部分元素构成的子向量A[子向量序号构成的向量B] # 选取向量A中序号为向量B中元素的向量# e.g.
2020-10-17 19:02:11
4366
原创 R语言笔记-R的安装,包的概念,基本数学计算,对象和工作空间
R的安装安装R安装RStudioRStudio是目前最受欢迎的R语言图形界面编辑器之一包 (packages)包的安装R:程序包->安装程序包,选择镜像,选择包,即可RStudio:右下角Packages->Install加载包到内存中:library()或require()检查内存中是否已加载目标包:search,然后检查packages中有没有更新包RStudio:Packages->Updateupdate.packages()基本
2020-10-17 00:22:57
408
原创 二元Logistic回归
引言搞了若干次这个东西,还是似懂非懂。得啃啃这个骨头了。概述研究分类反应变量与多个因素之间的关系,使用Logistic回归典型例子:疾病的病因 (危险因素)分析按反应变量分类二分类:二元Logistic回归多分类无序:多元Logistic回归多分类有序:定序回归 (ordinal regression)按个案是否经过匹配分类非条件Logistic回归条件Logistic回归二元Logistic回归概述一般线性模型中的一种,即反应变量 (dependent va
2020-10-16 22:58:08
15619
原创 重症医学数据库MIMIC-IV简介
前言继MIMIC-III之后,MIT又发布了全新版本的数据库MIMIC-IV。目前版本为V0.4。本文主要对MIMIC-IV进行简要介绍。引用要求When using this resource, please cite:Johnson, A., Bulgarelli, L., Pollard, T., Horng, S., Celi, L. A., & Mark, R. (2020). MIMIC-IV (version 0.4). PhysioNet. https://doi.org/
2020-10-09 21:59:02
20521
17
原创 《控制论导论》读书:变异度-传输变异度
引言研究一组可能事件是如何通过机器传输的;也即输入处一组可能事件与输出处一组可能事件之间的关系只要机器是确定性的,这一传输过程就是严格可以分析、处理的编码与译码编码即变换编码中的“关键语/密钥”即变换中的参数解码即逆变换;仅一一变换才存在单值的逆变换从变异度的角度理解:一一变换不改变变异度,而单值变换可能减小变异度;要使得编码过程中不损失信息,必须在每一步都采用一一变换示例:机器编码设变换器M,能处于S1,S2,...,SnS1,S2,...,SnS1,S2,...,Sn中
2020-10-09 18:07:24
235
原创 《控制论导论》读书:变异度-度量变异度
引言一批事实/现象先前谈论的是一个机器/系统,现在谈论的是一批机器/系统科学研究给出的命题总是针对一批事实/现象的:可重复性是科学研究的重要特征但对一批事实/现象的断言,对于构成这一批事实/现象的单个个体不见得适用统计学断言回归到个体,有可能毫无意义部分关于“构成比”的断言回归到个体,可以联系到“概率”的概念所有可能的消息:囚犯探视问题要求:探望囚犯时不允许带给他任何信息;但探望者可以给囚犯送一杯咖啡但狱吏怀疑囚犯与探望者在先前就达成过关于传递暗号的约定问题:狱吏怎么做才能避
2020-10-09 01:13:46
257
原创 《控制论导论》读书:机构-黑箱
黑箱的一般定义对于一动力系统具有特定的输出/可观测的状态(但不一定所有状态分量都能被观测到)具有/不具有输入端且该系统内部的运行机制是不允许/不能被观测的称该动力系统为黑箱黑箱的研究方式考虑黑箱可能是含时的(内部性质随时间而发生改变)以表格形式记录试验时间、输入、输出构成的这一串记录,称为该黑箱的“登记表”黑箱的标准表达式假定黑箱具有变换器的性质根据黑箱的登记表,列出黑箱在不同输入条件下输出的情况输出的变化情况据此可以判定系统是不是确定性的并推导出其标准表
2020-10-09 00:52:55
492
原创 《控制论导论》读书:机构-稳定性
引言:不变量对于系统状态的论断恒不成立在特定时间范围内成立恒成立平衡状态对于一动力系统的某一状态及某一给定的变换若该动力系统在该变换下保持该状态离散情形:下一步状态完全等同于此时状态连续情形:各状态分量相对于时间变化率为0称就该变换而言,该状态为该动力系统的1个平衡状态循环圈对于一动力系统的一系列状态及某一给定的变换若该动力系统在该变换下无限地于该一系列状态中呈现有规律的循环称就该变换而言,该一系列状态间的有向连接为该动力系统的1个循环圈稳定域对于某
2020-10-09 00:18:23
256
原创 《控制论导论》读书:机构-有输入的机器
本节提要:确定性机器:给定初值,放任自流有输入的机器:给定初值,观察机器在不同操作下的响应参数作用于同一组原象上的多个变换这一组原象表示该机器的状态矢量这多个变换表示该机器可能具有的多种操作模式(性能)在不同的操作模式下,机器的状态矢量可遵循不同的迹线参数举例:对状态矢量(a,b,c,d)施行可能的变换R1,R2,R3,记为:↓abcdR1R1(a)R1(b)R1©R1(d)R2R2(a)R2(b)R2©R2(d)R3
2020-10-08 23:59:44
160
原创 《控制论导论》读书:机构-确定性机器
确定性机器行为与封闭单值变换相同的那种机器,称为确定性机器(determinate machine)不去关心机器本身的物理实质外界对其不产生积极作用该机器下一阶段的状态,取决且仅取决于该机器当前阶段的状态状态一个系统的“状态”(status)指这个系统中具有确定标志的/可识别的一簇性质/状况的合称一个系统可以具有许多可能的状态迹线一个系统随着时间的推移尽管系统本身实际上是被特定算子所推动的但控制论中不关心该特定算子的物理实质(e.g. 钟表受如何的机械力作用而
2020-10-08 23:49:59
162
原创 《控制论导论》读书:机构-变化
对变化的简单假设变化总是可以分解为有限步骤完成的每一给定步骤中的变化总不是无穷小的离散变化可以连续化,在此并不讨论转移皮肤被晒黑的例子白皮肤受到太阳的作用被晒黑了白皮肤——受到作用的对象——原象/被映元素太阳——起作用的因素——算子——作用素黑皮肤——作用后变成的对象——映象/变换象记为:白皮肤→黑皮肤一个原象在算子的作用下变成映象的过程,称为“转移”变换一批原象在算子的作用下变成一批映象的过程,称为“变换”对于变换本身,只关心该变换可以作用的一批原象有哪些
2020-10-08 23:43:51
167
文献计量学软件HistCite Pro 2.1
2020-10-19
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人