R语言中的抽样方法及示例代码
抽样是数据分析中常用的一种技术,它可以从一个较大的数据集中选择一部分样本进行分析,以代表整体数据集。R语言提供了多种抽样方法和函数,使得我们能够灵活地进行数据抽样。本文将介绍几种常见的抽样方法,并提供相应的示例代码。
- 简单随机抽样(Simple Random Sampling)
简单随机抽样是最基本的抽样方法,每个样本被选中的概率相等且独立。在R语言中,可以使用sample()
函数进行简单随机抽样。以下是一个示例代码:
# 创建一个向量
data <- c(1, 2, 3, 4, 5, 6, 7, 8, 9, 10)
# 简单随机抽样,抽取3个样本
sample_data <- sample(data, size = 3)
# 输出抽样结果
print(sample_data)
- 分层抽样(Stratified Sampling)
分层抽样是将总体划分为若干个层次(或分层),然后从每个层次中独立地进行简单随机抽样。R语言中,可以使用strata()
函数进行分层抽样。以下是一个示例代码:
# 创建一个数据框
df <