跳转到内容

统计分析:使用 R/R/包入门

来自维基教科书,开放的书籍,为开放的世界
R 的强大和深度来自于其提供的各种函数和其他对象。这些实际上是由各种独立的提供的。例如,图 1.1 基于“datasets”包中的数据。要使用包的内容,必须将其提供给 R,然后将其加载到 R 会话中。

某些包应始终在 R 中可用,并且其中许多包在 R 会话开始时自动加载。这些包括“base”包(其中定义了max()sqrt()函数)、“utils”包(其中定义了RSiteSearch()citation())、“graphics”包(允许生成绘图)和“stats”包(提供广泛的统计功能)。总的来说,默认包允许你进行大量的统计分析。

然而,R 的优势之一是可用的各种附加包。例如,包允许你分析遗传数据、与地理信息系统交互、进行经济分析等等。要将包提供给 R,你需要下载并将其安装到系统中的某个位置。有一个中心位置(称为“CRAN”)可以下载大多数附加包。安装包后,可以使用library()函数随时将其加载到 R 中。
输入
library("datasets")  #Load the already installed "datasets" package
cars                #Having loaded "datasets", the "cars" object (containing a set of data) is now available
library("vioplot")    #Try loading the "vioplot" package: will probably fail as it is not installed by default
install.packages("vioplot") #This is one way of installing the package. There are other ways too.
library("vioplot")    #This should now work
example("vioplot")    #produces some pretty graphics. Don't worry about what they mean for the time being
结果
> ## 注意,“datasets”包默认安装,并提供有用的示例数据

> library(datasets) # 加载 datasets 包(实际上,它可能已经加载了)> cars # 显示其中一个数据集:查看 ?car 获取更多信息

  speed dist

1 4 2 2 4 10 3 7 4 4 7 22 5 8 16 6 9 10 7 10 18 8 10 26 9 10 34 10 11 17 11 11 28 12 12 14 13 12 20 14 12 24 15 12 28 16 13 26 17 13 34 18 13 34 19 13 46 20 14 26 21 14 36 22 14 60 23 14 80 24 15 20 25 15 26 26 15 54 27 16 32 28 16 40 29 17 32 30 17 40 31 17 50 32 18 42 33 18 56 34 18 76 35 18 84 36 19 36 37 19 46 38 19 68 39 20 32 40 20 48 41 20 52 42 20 56 43 20 64 44 22 66 45 23 54 46 24 70 47 24 92 48 24 93 49 24 120 50 25 85 > library(vioplot) # 尝试加载“vioplot”包:这可能会失败,因为它默认情况下未安装 Error in library(vioplot) : 找不到名为 'vioplot' 的包 > install.packages("vioplot") # 这是安装包的一种方式。还有其他方法。同时安装依赖项“sm”

正在尝试 URL 'http://cran.uk.r-project.org/bin/macosx/universal/contrib/2.8/sm_2.2-3.tgz' 内容类型 'application/x-gzip' 长度 306188 字节 (299 Kb) 已打开 URL

=======================

已下载 299 Kb

正在尝试 URL 'http://cran.uk.r-project.org/bin/macosx/universal/contrib/2.8/vioplot_0.2.tgz' 内容类型 'application/x-gzip' 长度 9677 字节 已打开 URL

=======================

已下载 9677 字节


已下载的包位于 /tmp/RtmpR28hpQ/downloaded_packages > library(vioplot) # 这现在应该可以工作 Loading required package: sm 包 `sm',版本 2.2-3;版权所有 (C) 1997、2000、2005、2007 A.W.Bowman & A.Azzalini 输入 help(sm) 获取摘要信息 > example(vioplot) # 生成一些漂亮的图形。暂时不用担心它们的含义

vioplt> # 箱线图与小提琴图 vioplt> par(mfrow=c(2,1))

vioplt> mu<-2

vioplt> si<-0.6

vioplt> bimodal<-c(rnorm(1000,-mu,si),rnorm(1000,mu,si))

vioplt> uniform<-runif(2000,-4,4)

vioplt> normal<-rnorm(2000,0,3)

vioplt> vioplot(bimodal,uniform,normal) 按 <回车> 查看下一张图

vioplt> boxplot(bimodal,uniform,normal)

vioplt> # 添加到现有图中 vioplt> x <- rnorm(100)

vioplt> y <- rnorm(100)

vioplt> plot(x, y, xlim=c(-5,5), ylim=c(-5,5)) 按 <回车> 查看下一张图

vioplt> vioplot(x, col="tomato", horizontal=TRUE, at=-4, add=TRUE,lty=2, rectCol="gray")

vioplt> vioplot(y, col="cyan", horizontal=FALSE, at=-4, add=TRUE,lty=2)

请注意,某些包需要安装其他包才能正常工作(一个包被称为“依赖”于另一个包)。例如,“vioplot”需要“sm”包。如果这些依赖包未安装,则无法在 R 中加载原始包。在上面调用install.packages()的方式安装包时,也应该安装依赖项[1]

还有其他几种安装包的方法。如果通过在 unix 命令行上键入“R”来启动 R,则可以通过从命令行运行“R CMD INSTALL packagename”来安装包(查看?INSTALL)。如果使用图形用户界面(例如在 Macintosh 或 Windows 下)运行 R,则通常可以通过使用屏幕菜单来安装包。请注意,这些方法可能不会安装其他依赖包。


  1. 实际上,细节稍微复杂一些,具体取决于是否存在安装包的默认位置,请查看?install.packages
华夏公益教科书