自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(367)
  • 收藏
  • 关注

原创 R语言——随机区组试验设计1

各自的差异有无统计学差异的情况,不管是两个或多个处理组,均可采用完全随机区组试验设计。随机区组试验设计,按照一定的条件,将几个条件相同的受试对象划分为一个区组,然后在每个区组内部按随机原则将每个受试对象分配到各组,对每组分别实施不同的处理,然后对其结果进行方差分析。随机区组试验设计时,第一因素应当安排研究的主要因素,第二因素相对次要一点,可以是待考察的因素,也可以是仅仅为了排除它对试验结果的影响。正确划分区组的条件十分重要,总的原则是必须将对试验结果有明显影响的非处理因素列为划分区组的条件,要求。

2025-04-30 01:00:00 741

原创 R语言——完全随机试验设计2

上述完全随机试验设计的数据分析方法,都是基于试验指标正态分布的计量数据,若所获得的试验指标为计数资料,则需要采用非参数的检验法,这里不做介绍。除了通过方差分析,分析多个处理组之间的差异是否具有统计学意义,在R中,还可以通过图形分析的方法,直观地对多个处理组进行比较。因素水平数为2,即处理数为2的两组试验数据,数据性质为计量资料,通常采用t检验对试验数据进行统计学分析。首先计算各组的均值、标准差等,并绘制出两组数据的箱线图,对数据进行基本的探索性分析。方差分析结果显示,五种药物疗法的效果具有显著的不同。

2025-04-29 01:00:00 498

原创 R语言——完全随机试验设计1

完全随机试验设计也叫组间设计被试对象被分成若干组,每组分别接受一种试验处理,有几种试验处理就分为几组,各试验组的受试对象之间相互独立,因而又叫独立组试验设计。完全随机试验设计的本质是将供试对象随机分组,就是要保证每个供试对象都有相同机会接受任何一种处理,而不受试验人员主观倾向的影响。完全随机试验设计也称为单因素试验设计,或成组试验设计,是科学研究和生产实践中最常用的一种试验设计方法。(3)由于未应用局部控制的试验原则,非试验因素的影响被归入试验误差,试验误差较大,试验的精确性较低。完全随机试验设计是采用。

2025-04-28 01:00:00 234

原创 R语言——回归分析6

在很多实际问题中,变量之间的关系可能是非线性的,此时需要采用非线性回归模型。非线性回归具有多种多样的形式,如双曲线、二次曲线、三次曲线、幂函数曲线、指数函数曲线、S形曲线、对数曲线、指数曲线等。因此,非线性回归分析的关键是确定函数的具体形式。在确定非线性函数具体形式之后,仍然是通过最小二乘法获得回归模型,并对其进行统计学的检验。回归系数的显著性检验、回归方程的方差分析结果均显示:x一次及二次项对y都有显著影响。对回归方程的显著性检验结果表明,所建立的多元非线性回归方差与试验数据拟合得较好。

2025-04-27 01:00:00 235

原创 R语言——回归分析5

在残差分布Q-Q图中,落在置信区间以外的点,可以认为是离群点。car包提供了离群点的统计检验方法,outlierTest()函数可以计算最大标准化残差绝对值Bonferroni调整p值,可作为判断是否为离群点的依据。car包的avPlots()函数可以绘制变量添加图,即每个自变量xi绘制xi在其他自变量上回归的残差值相对于因变量在其他自变量上回归的残差值的关系图。上图中的直线表明相应自变量的实际回归系数,可以通过观察删除某些强影响点后直线改变情况来评估强影响点的影响情况。是与其他自变量有关的离群点。

2025-04-26 01:00:00 1146

原创 R语言——回归分析4

对于多个自变量与一个因变量的多元线性回归分析,可以利用逐步回归分析的方法来选择进入回归模型对因变量有显著影响的自变量。但是,这只是从选择自变量的角度来研究问题,没有对模型的其他特性做进一步的分析,也没有对数据本身是否存在异常进行分析。若某个偏回归系数的t检验通不过,可能是该系数相对应的自变量对因变量的影响不显著的原因,那么,可以将该自变量从回归模型中删除,在重新建立回归模型,或更换自变量。自变量之间的共线性或隐藏变量的显著性,增加参数估计的误差,同时获得的模型稳定性下降。对模型造成过度依赖的数据往往是。

2025-04-25 01:00:00 697

原创 R语言——回归分析3

与一元线性回归汇总的决定系数r^2相对应,多元线性回归也有多重决定系数R^2,它是在因变量的总变化中,由回归方程解释的变动(回归平方和)所占的比重。在实际工作中,由于没有清洗的理论依据,回归模型中包含的自变量难以事先确定,如果在回归模型中引入一些不太重要的自变量,会降低模型的精度。其中,b_0为常数项,b1,b2,...,b_k为回归系数,b1是x2,x3...,x_k固定时,x1每增加一个单位对y的效应,即x1对y的偏回归系数。估计标准误差,即因变量y的实际值与回归方程求出的估计值。

2025-04-24 01:00:00 783

原创 R语言——回归分析2

对于给定的显著性水平α,显著性检验要求|r|>r_min时,才说明y与x之间现在密切的线性相关关系,或者说,用所求得的回归方程描述变量y与x之间关系才有意义;cor.test()函数输出结果中,对两变量的相关系数进行了t假设检验,t值为46.169,检验的p值为5.353e-11,同时也输出了相关系数的95%的置信区间为[0.9917926,0.9995744]及其相关系数的大小0.9981,表明变量X与Y高度正相关。根据计算得到的F与临界值之间的关系,判断y与x之间有无明显的线性关系。

2025-04-23 01:00:00 810

原创 R语言——回归分析1

例如,身高与体重的关系,一般情况下,身高越高,体重越重,但是这一规律很难用一个确定的函数关系式来精确描述,然而两者之间确实存在相关关系。若使x取一组不完全相同的值xi(i=1,2,····,n),进行独立试验,就得到与之对应的一组观察值yi(i=1,2,····,n),称xi为自变量,yi为因变量。如果y与x的关系是线性的,则称为一元线性回归。变量之间的关系,通常可以分为两种类型:确定性关系和相关关系当一个变量或几个变量取一定数值时,另一个变量有确定值与之对应,即变量之间存在完全确定的。

2025-04-22 01:00:00 734

原创 R语言——方差分析5

做方差分析时,可根据资料设计的类型及研究目的,将总变异分解为两个或多个部分,每个部分的变异可由某因素的作用来解释,通过比较可能由某因素所致的变异与误差(或组内)变异,即可了解该因素对测定结果有无影响。如果统计分析时只分析最后一次测量结果,会丧失很多“过程”,如测量指标的时间趋势等,而且在统计上,保留“处理”前得信息可以有效评价随机分组的均衡性,也能够提高统计分析的效率。根据输出结果,可以列出两个方差分析表,不同的method间差异显著,pressure在不同的method下不同时间变化的趋势不同。

2025-04-21 01:00:00 270

原创 R语言——方差分析4

所不同的是,双因素方差分析中,有时会出现交互作用,即两个因素的不同水平交叉搭配对试验指标产生影响。在这里,我们不再阐述双因素方差分析的有关变异的分解原理,仅以实例介绍R语言在双因素方差分析中的具体应用。采用aov()函数进行方差分析,由于函数的结果未列出方差分析表中的总和行,我们可以采用自编函数anova.table()来获得完整的方差分析表。HH包中的interaction2wt()函数也可以是绘制类似图形,该函数绘制的图形对任意顺序的因子设计的主效应和交互效应都会展示。(1)不考虑交互作用的方差分析。

2025-04-20 01:00:00 238

原创 R语言——方差分析3

qqPlot()函数需要lm()函数拟合,在本例中绘制的Q-Q图,数据均落在了95%的置信区间内,说明数据满足正态性假设,与shapiro.test()函数进行w正态性检验结果是一致的。因此,根据正态性检验、方差齐性检验和离群点检验,该数据可以进行方差分析,且结果可信。Shapiro-Wilk正态检验结果表明,5种方法除杂量数据均是正态分布。在R中,w检验方法可以通过shapiro.test()函数来完成。,可以利用car报中的outlierTest()函数来检测离群点。③随机性:所有数据都相互独立。

2025-04-19 01:00:00 315

原创 R语言——方差分析2

其中x为响应变量构成的向量,g为分组向量(因子),p.adjust.methods是p值调整的方法,具体有"holm", "hochberg", "hommel", "bonferroni", "BH", "BY", "fdr", "none"。但在均值的多重检验中,如果因素的水平较多,而检验又是同时进行,从R的输出结果可以看出,summary()函数没有输出最后一行的总和行,可以自行编写一个anova.table()函数,将summary()函数输出的第一行和第二行求和,得到总和行。

2025-04-18 01:00:00 838

原创 R语言——方差分析1

是:如果被考察的因素对试验结果没有显著的影响,即所讨论的各正态总体的均值相等,则试验数据的波动完全由随机误差引起;通过上述的变异的分解可以看出,方差分析的基本思想就是根据试验设计的类型,将全部测量值的离均差平方和及其自由度分解为两个或多个部分,除随机误差作用外,每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释,通过比较不同变异来源的均方,借助F分布作出统计推断,从而推断各种研究因素对试验结果有无影响。引起的可以控制的波动。另一部分是因素A的平方和S_A,是由因素A的各水平的差异引起的。

2025-04-17 01:00:00 492

原创 R语言——试验数据的统计推断2

假设检验是对总体的特征(如总体的参数或分布、位置)提出某种假设,如果假设筒体均值为一定值、总体均值相等、总体分布为某种分布、两个总体分布位置相同等等,然后根据随机样本提供的信息,根据统计量的分布规律计算出检验统计量,再根据计算出来的检验统计量确定其概率值,运用小概率原理,由p值判断样本是否只支持原假设,推断假设是否成立,并对假设做出取舍决策,从而最终做出统计推断。否定假设的依据就是小概率原理。检验的P值表示对原假设的怀疑程度,或解释为首次拒绝原假设的概率,P值越小,表示原假设越可疑,从而越应该拒绝原假设。

2025-04-16 01:00:00 831

原创 R语言——试验数据的统计推断1

当标准差未知,不需要输入,此时需要考虑两总体的方差是否相等,如果两总体方差相等,输入var.equal=TRUE,程序采用自由度为n1+n2-2的t分布计算置信区间;函数中,x为来自总体的样本数据所构成的向量,sigma为总体的标准差,当标准差已知时,输入相应的值,程序采用正态分布计算置信区间;某人称自己的体重(单位500g)10次的数据:175,176,173,175,174,173,173,176,173,179。来估计μ,用s估计σ等,其方法简单,但这种统计推断方法没有考虑抽样误差的大小。

2025-04-15 01:00:00 915

原创 R语言——信息、警告、错误处理

如果要防止出现这种情况就是把容易出现错误的代码包括在try函数中,虽然错误仍然会打印到控制台上,但是代码不会停止执行。在下例中,当发生错误时,我们会打印错误消息并返回一个空的数据框。常见的例子是:糟糕的用户输入、较差的数值精度,或意想不到的副作用。message函数能够把它所有的输入拼接起来,中间不需要任何的空格,然后它们都写到控制台。使用tryCatch的另一个技巧:我们可以把一个表达式传递给一个命名为finally的参数,无论错误是否抛出,它都会运行。R语言有三种函数能把程序状态的诊断信息显示出来。

2025-04-14 01:00:00 1416

原创 R语言——线性回归模型

在“Residuals vs Fitted”绘图中右侧出现了大的正残差,这些点在“Normal Q-Q”图中也是明显高于标准线,并且也出现在了“Cook's distance”绘图中的峰值。在本例中,我们只更新公式的右边,而左边保持不变。由lm返回的模型变量相当复杂,为简便起见,在此我们不包括其输出,但我们可以按照通常的方法来探索这些模型的结构。通常,我们不会满足于所得到的第一个模型,而是想找到“最佳”模型或一些能提供洞见的模型。用于测量模型质量的指标,如p值和对数似然测量,通常用于模型间的比较。

2025-04-13 01:00:00 1537

原创 R语言——分布和公式

例如,环境进程生成了大量符合对数正态分布的变量,我们可能希望把它们包含到一个 log(var) 的线性回归中。例如,runif能生成均匀分布的随机数,rnorm能生成正态分布的随机数。这些函数的第一个参数都是要生成的随机数的数量,其它参数则会影响分布的形状。对于可包括截距的模型(几乎都是回归模型),这样的公式隐式包含了截距。这增加了所有可能的双向交互、三方交互,一直到所有自变量之间都有交互。也就是说,它们是由某种算法生成,而不是真正的随机过程。其中每个ai是一个由该模型决定的阐述,而e是正态分布的误差项。

2025-04-12 01:00:00 699

原创 R语言——条形图

barplot的第一个参数包含条形的长度,如果这是一个命名向量,那么这些名称将用作条形图上的标签。默认情况,条形图都是垂直的,但如果类型比较多,通常使用水平条形图。类似base系统,ggplot2默认使用竖直的条形图,添加coord_flip可使它翻转为水平的条形图。las参数(即label axis style的缩写)控制标签是水平还是垂直的、是平行的还是垂直于轴的。此参数的另一种选项是position="fill",它所创建的每个堆积条都具有同样的高度,范围是0~100%。2、lattice方法。

2025-04-11 01:00:00 275

原创 R语言——箱线图

箱线图(boxplot)也被称为盒须图或盒形图,可以让我们一次比较多个分布。虽然我们不能得到像直方图或核密度图那么多细节,但简单的高低和宽窄之间的比较是没有问题的。在本例中,我们可以直接将boxplot替换为bwplot(bw是b(box)和w(whisker)的简称)在某种意义上,如果我们重新把箱线图从小到大排序,这种类型的绘图往往会更清晰。base系统中绘制箱线图的函数是boxplot,它需要一个公式接口且需要data参数。在ggplots2中绘制箱线图只需要我们添加一个geom_boxplot。

2025-04-10 01:00:00 373

原创 R语言——直方图

ggplot2直方图是通过添加一个直方图的geom来创建的。lattice中的直方图与base类似,不过它还使用了一个data参数,这个参数使它能更易于分割成多个面板,且能把绘图保存为变量。lattice中的直方图能通过type参数为"count"、"density"或"percent"指定y轴的显示类型:计数、概率密度和百分比,默认是百分比。在base中可以使用hist函数绘制直方图,与plot函数一样,它没有data参数,须把数据框置于with中。如果我们要研究一个连续变量的分布,直方图是最佳的选择。

2025-04-09 01:00:00 489

原创 R语言——线图

与散点图一样,lattice也使用xyplot来画线图,但同样也要使用type="l"的参数。对于只有两条线的场景,还有一个更好的解决方案,它不需要任何的数据操作。然而,这样需要调用geom_line两次,且在实际应用中相对较少。在base图形系统中,线图与散点图的创建方式一样使用plot函数,不同的是线图采用参数type="l"。为线图额外添加附加线,可以使用lines函数在现有绘图中重叠绘出。在ggplots中从散点图切换到线图非常简单,只要把geom_point替换为geom_line即可。

2025-04-08 01:00:00 364

原创 R语言——散点图

轴的尺度需要以不同的方式指定。col能改变点的颜色,它可以接受任何通过colors返回的已命名颜色,或者向"#123456"的HTML风格的十六进制值。log="x"表示使用x轴为对数坐标,log="y"表示使用y轴为对数坐标,而log="xy"则表示同时使用x和y轴作为对数坐标。ggplot2不仅能识别来自base图形系统的命令来改变点的颜色和形状,而且也有自己的一套更加可读的名称。lattice系统的另一个好处是它能把绘图存储在变量中(base只能把绘图绘制在窗口),因而可在之后更改它们。

2025-04-07 01:00:00 916

原创 R语言——统计汇总

cummin和cummax能分别累计计算向量中的最小值和最大值。同样的,cumsum和cumprod能计算数据中的累加和累乘。cor函数能够计算数值向量之间的相关性。table函数对于obama变量(或其他的数值型变量)来说意义不大,因为每个值都是唯一的。我们只能使用一种算法,且只能算出默认位数。var和sd分别计算方差和标准差。用于计算平均绝对偏差的是mad函数。则能计算相同长度的若干向量中在相同位置的最小值和最大值。函数只需一行函数就能给出最小和最大值。,它们分别给出输入的最小值和最大值。

2025-04-06 01:00:00 318

原创 R语言——数据整理3

例如,+运算符能计算两个数据字典的综合,但sum函数能计算多个输入的总和。sum(a,b,c,d,e)相当于Reduce("+",list(a,b,c,d,e))这种说法有点令人头晕,你需要了解的是:x[order(x)]将返回与sort(x)相同的结果。Negate函数是接受一个谓词(即一个返回逻辑向量的函数)并返回一个刚好相反的谓词。Reduce("+", list(a, b, c, d, e))相当于((((a + b) + c) + d) + e)Position函数的行为向which函数。

2025-04-05 01:00:00 247

原创 R语言——数据整理2

从另一个角度看,每一列中的头骨测量数据都是同一类型的东西(即测量值),只是测量的方式不同。因此,另一种表示该数据的方式是:每个鹿都有 4 行数据,每行有以下几列:一列是和之前一样颅骨的 ID(所以每个值将被重复四次),一列为测量值,还有一列用于解释本行所在的测量类型的因子。它的每一列包含了对某种类型的鹿的测量结果。在 plyr 包中的mutate函数采取了另一种方法,它接受新的和更改的列,并把它们当成“名称 - 值” 对。我们还可是使用na.omit函数,它能删除数据框中的所有带有缺失值的行。

2025-04-04 01:00:00 337

原创 R语言——数据整理1

在alpe_d_huez循环数据集中,DrugUse列中的数值被编码为“Y”和“N”,而不是TRUE和FALSE。grep、grepl和regexpr函数都能够找到与模式相匹配的字符串,sub和gsub函数能够替换匹配的字符串。在下例中,我们将匹配一“m”开头的(^)、后面跟着一个可选的(?我们可以用str_count计算出它们在每个名称中的出现次数,然后用sum来对所有统治者求和计算出总的出现次数。如果想把name列进行拆分,可以使用str_split(或用R基本报中的strsplit,作用基本一样)

2025-04-03 01:00:00 367

原创 R语言——获取数据3

DBI包为访问DBMS提供了统一的语法——目前的 SQLite、MySQL/MariaDB、PostgreSQL和 Oracle都能支持,它还提供了一个封装了JDBC(Java Database Connectivity)API的函数。对于PostgreSQL、Oracle和JDBC来说,它们分别需要PostgreSQL、ROracle和RJDBC包,它们的数据库名也是其驱动程序的名字,与SQLite和MySQL一样。对于MySQL数据库来说,则需加载RMySQL包,并设置驱动器类型为“MySQL”

2025-04-02 01:00:00 671

原创 R语言——获取数据2

foreign包中包含了使用read.ssd读取SAS永久数据集、使用read.dta读取Stata的DTA文件、使用read.spss读取SPSS数据文件的方法。使用read.xlsx2的运行速度更快。read.table(以及其衍生函数,例如read.csv)接受一个URL作为参数(而不是一个本地文件),它会在导入数据之前将副本下载到一个临时文件中。R可以使用h5r包(以及在Bioconductor中的rdhf5包)读取分层数据格式V5[HDF5]文件,亦可使用ncdf包读取网络通用数据格式。

2025-04-01 01:00:00 499

原创 R语言——获取数据1

在上图这种情况,我们不能仅调用read.csv就把所有东西都读出来,因为不同的数据块中所含有的字段数量不同,而且每个字段也确实不同。更多高级选项包括:覆盖默认的行名、列名和类,指定输入文字的字符编码,以及输入的字符串格式的列如何声明。如果文件的结构松散,更简单的做法是:先读入文件中的所有文本行,再对其内容进行分析或操作。如果我们想访问任意数据集里的数据,只需调用data函数,传入数据集的名称及其所在的包名(如果此包已经加载,可省略这个packages参数)R能从各式各样的来源中读取,且支持大量的文件格式。

2025-03-31 01:00:00 1577

原创 R语言——日期和时间2

如果我们的日期数据的形式有所不同,可以使用lubridate提供的其他函数(ydm、mdy、myd、dmy和dym)。这些函数都有相关的函数用于指定特定的时间格式,例如ymd_h、ymd_hm和ymd_hms。如果我们的日期不在以上任何一种格式中,则使用更低级的函数parse_date_time来实现。“持续时间”(Duration)指定的时间跨度为秒的倍数,所以一天的总时间是86400秒,一年的时间3156000秒(86400×365)。lubridate是在日期处理的过程中,使代码的可读性更强。

2025-03-30 01:00:00 1810

原创 R语言——日期和时间

我们可以使用strptime函数(string parse time的简称),它将返回POSIXlt日期(还有as.POSIXct函数和as.POSIXlt函数,调用它们时,如果输入的是字符,那么它们只是strptime的封装函数)。下例中,%I表示小时(12小时制),%p是AM/PM指示,%A是星期几的全称,而%B是月的全名。负的时间在UTC的东边,正的在西边。如果觉得strftime不好记,我们可以使用format函数来轻松完成日期的格式化,与strftime函数的使用方法几乎是一样的。

2025-03-29 01:00:00 862

原创 R语言——包

与库位置的默认设置相关的一个问题是,当我们升级R时需要重新安装所有的包。这是最安全的行为,因为不同的R常常需要使用不同版本的包。installed.packages函数将返回一个数据框,它包含了R所知道的我们电脑上的所有包的信息。最后两个值,一个是特殊的始终被称为Autoloads的环境,另一个是base包。R安装时就自带的包(base、stats以及其他大概30个)都存储在我们安装R的library子目录中。库(library)是我们电脑上的文件夹,而包就存储在文件夹内的文件中。(2)库和已经安装的包。

2025-03-28 01:00:00 736

原创 R语言——高级循环2

mapply是“多参数列表应用”(multiple argument list apply)的简称,它能让我们传入尽可能多的向量作为参数,这解决了上面的第一个问题。常见的用法是传入一个列表,再传入另一个列表作为前者的名字,这就解决了第二问题。有点烦人的是,为了任意数目的向量参数,参数的顺序改变了。plyr包中最常用的函数是ddply,它的输入和输出都是数据框,它可以替换tapply函数。llply 的输入参数是列表,它将函数应用于每个元素上,并返回一个列表,这使它成为 lapply 的一个替代函数。

2025-03-27 01:00:00 591

原创 R语言——高级循环1

和前面一样,它的输入参数是一个列表和函数,但vapply还需要第三个参数,即返回值的模板。现在,假定生成均匀分布随机数的unif函数不是矢量化的,那么rep函数每次都将重复出现相同的随机数,而replicate函数每次的结果都不相同。下例中,将分析某人上下班时使用不同交通工具所花费的时间:time_for_commute函数用sample随机挑选一种交通工具(小汽车、公交车或自行车),然后用rnorm或rlnorm找到一个正态分布或对数正态分布的行程时间(具体参数取决于所选的交通工具)。

2025-03-26 01:00:00 859

原创 R语言——循环

因为for循环操作于向量中的每个元素,所以它提供了一种“伪向量化”。注意,R的for循环几乎总是比其对应的向量化运行得要慢,而且往往是一到两个数量级的差别。在每个循环中,迭代器变量会从向量中取得一个值。它不是先执行代码再检查循环是否应该结束,而是先进行检查再执行代码。下面这个代码将反复执行,直到我们按下escape键、退出R为止。虽然向量化意味着我们可能并不需要大量使用它们,但在需要重复执行代码时,它们是非常有用的。一般来说无限循环不是我们想要的,因此需要一个break语句来跳出无限循环。

2025-03-25 01:00:00 399

原创 R语言——流程控制

它的常见用法是:第一个参数为返回字符串的表达式,其后的参数为第一个参数相匹配时的返回值。它们应与第一个向量的长度相等(如果不等,那么第二个和第三个参数中的元素将重复或忽略,以使它们与第一个参数的长度相同)。如果条件参数中有缺失值,那么结果中的相应位置也是缺失值。在这种情况下,其余的参数不需要名字——如果第一个参数结果为1,那么将返回第二个参数的结果;在上面这种情况下,如果我们要测试的整数非常大,这将相当麻烦,因为我们需要提供很多参数。如果if的条件值为FALSE,这会执行else只有的代码。

2025-03-24 01:00:00 731

原创 R语言——因子

如果我们有一些脏数据,例如打错了的数字,在数据导入的过程中,R会将他们解释为字符串。在下例中,其中一个数字有两个小数点,诸如read.table的导入函数将无法把这样的字符串解析为数字格式,而会默认把这一列转换为字符向量。一个汇总数值变量的方法是计算有多少个值落入不同的“组”(bins)中,cut函数能将数值变量切成不同的块,然后返回一个因子。在这种情况下,我们只需指定第一个水平的值,但多数情况下,使用factor函数来设置水平值。为了平衡数据,使到每个水平的数据点的数目相等,可用gl函数来生成因子。

2025-03-23 01:00:00 729

原创 R语言——字符串

在它传入的参数向量中,每个元素都能够自我循环以达到最长的矢量长度,然后字符串就被拼接在一起,中间以空格分开。formatC可以让我们用C语言的格式化风格来指定使用固定型或科学型的格式、小数的位数以及输出的宽度。将光标移动到下一行是通过打印换行符\N完成的(在R中,不要使用\r或\r\n来打印换行符,因为\r会将光标移动到当前行的开始并覆盖我们所写的内容);在我们的例子中,某些词最后的逗号有些烦人。与之相反,如果在被双引号引用的字符串中使用单引号,或在单引号引用的字符串中使用双引号,则并不需要对其进行转义。

2025-03-22 01:00:00 1584

R语言-箱线图Nimrod数据集

R语言-箱线图Nimrod数据集

2025-05-04

基因型-性状双标图(GT双标图)作图数据

基因型-性状双标图(GT双标图)作图数据

2025-02-23

双标图与矩阵乘法演示实例

双标图与矩阵乘法演示实例

2025-02-07

shukla方差和相对平均偏差

shukla方差和相对平均偏差

2024-11-10

pyecharts.datasets.map-filenames.json 文件

pyecharts.datasets.map-filenames.json 文件

2024-10-31

用excel进行高稳系数法分析

用excel进行高稳系数法分析

2024-08-23

基于R语言绘制GGE双标图3

基于R语言绘制GGE双标图3

2024-08-04

一个可以自动生成随机区组试验的excel VBA小程序2

一个可以自动生成随机区组试验的excel VBA小程序2

2024-06-03

一个可以自动生成随机区组试验的excel VBA小程序

一个可以自动生成随机区组试验的excel VBA小程序

2024-05-28

一个可自动生成行田间种植规划图的excel VBA小工具

一个可自动生成行田间种植规划图的excel VBA小工具

2024-04-29

田间种植行排号自动生成工具

育种、测试、田间规划、行排号、

2024-04-27

seaborn常用数据案例

anagrams、anscombe、attention、brain_networks、car_crashes、diamonds、dots、dowjones、exercise、flights、fmri、geyser、glue、healthexp、iris、mpg、penguins、planets、seaice、taxis、tips、titanic

2024-04-21

python-活用pandas库数据集

python,pandas,dataframe,seires,dataframe基础知识,pandas数据结构,绘图入门,数据组合,缺失数据处理,数据整理,文本数据处理,数据建模

2024-04-15

R语言+统计分析+源数据

R语言编程基础,数据框操作,ggplot2绘图基础,描述性统计分析,常见统计分析方法(方差分析、聚类分析、判别分析、主成分分析),回归分析(线性回归、回归诊断、多重共线性、逐步回归、Logistic回归、Poisson回归),机器学习,数字图像处理,并行计算

2024-04-04

excel统计分析相关文件

AD检验、CVM检验、K-S检验、Lilliefors检验、P-P图、Q-Q图、S-W检验、偏度、峰度、箱线图、直方图、方差齐性检验、方差分析、Duncan、LSD、Scheffe、Sidak、Bonferroni、SNK、Tukey、秩和检验、卡方检验、非参数检验、拉丁方设计、裂区设计、嵌套设计、随机区组设计、正交设计、平衡不完全区组、logistic回归、线性相关、spearman相关系数、协方差、多元线性回归、多元相关分析、多项式回归等

2024-03-30

excel统计分析-两向分组资料的协方差分析

excel统计分析-两向分组资料的协方差分析

2024-03-23

excel统计分析-单向分组资料的协方差分析

excel统计分析-单向分组资料的协方差分析

2024-03-17

excel统计分析-秩相关分析

excel统计分析-秩相关分析

2024-03-16

excel统计分析-直线相关

excel统计分析-直线相关

2024-03-16

excel统计分析-曲线回归

excel统计分析-曲线回归

2024-03-12

excel统计分析-一元直线回归

excel统计分析-一元直线回归

2024-03-11

excel统计分析-嵌套设计

excel统计分析-嵌套设计

2024-03-05

excel统计分析-重复测量设计

excel统计分析-重复测量设计

2024-03-04

excel统计分析-裂区设计

excel统计分析-裂区设计

2024-03-03

excel统计分析-正交设计

excel统计分析-正交设计

2024-03-03

excel统计分析-拉丁方设计

excel统计分析-拉丁方设计

2024-02-28

python统计分析-逻辑回归

python统计分析-逻辑回归

2024-02-25

python统计分析-多解释变量的方差分析源数据

python统计分析-多解释变量的方差分析源数据

2024-02-22

excel统计分析-平衡不完全区组设计

excel统计分析-平衡不完全区组设计

2024-02-07

python+统计学+源码+用Python动手学统计学

python+统计学+源码+用Python动手学统计学

2024-02-03

excel统计分析-多组数据的秩和检验

excel统计分析-多组数据的秩和检验

2024-02-02

excel统计分析-成组数据秩和检验

excel统计分析-成组数据秩和检验

2024-02-01

excel统计分析-成对数据秩和检验

excel统计分析-成对数据秩和检验

2024-01-31

excel统计分析-卡方适合性检验

excel统计分析-卡方适合性检验

2024-01-30

excel统计分析-卡方独立性检验(中)

excel统计分析-卡方独立性检验(中)

2024-01-28

excel统计分析-卡方独立性检验(上)

excel统计分析-卡方独立性检验(上)

2024-01-28

excel统计分析-Duncan法多重比较

excel统计分析-Duncan法多重比较

2024-01-25

excel统计分析-Tukey‘s-b法多重比较

excel统计分析-Tukey‘s-b法多重比较

2024-01-22

excel统计分析-S-N-K法多重比较

excel统计分析-S-N-K法多重比较

2024-01-21

excel统计分析-Tukey法多重比较

excel统计分析-Tukey法多重比较

2024-01-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除