计算描述性统计量
:
1
、
summary():
例:
summary(mtcars[vars])
summary()
函数提供了最小值、最大值、四分位数和数值型变量的均值,以及因子向量和逻
辑型向量的频数统计。
2
、
apply()
函数或
sapply()
函数
计算所选择的任意描述性统计量。
mean
、
sd
、
var
、
min
、
max
、
median
、
length
、
range
和
quantile
。函数
fivenum()
可返回图基五数总括(
Tukey’s five
-number summary
,即最小值、
下四分位数、中位数、上四分位数和最大值)。
sapply()
例:
mystats
if (na.omit)
x
m
n
s
skew
kurt
return(c(n = n, mean = m, stdev = s, skew = skew, kurtosis = kurt))
}
sapply(mtcars[vars], mystats)
3
、
describe()
:
Hmisc
包:返回变量和观测的数量、缺失值和唯一值的数目、平均值、
分位数,以及五个最大的值和五个最小的值。
例:
library(Hmisc)
describe(mtcars[vars])
4
、
stat.desc()
:
pastecs
包
若
basic=TRUE
(默认值),则计算其中所有值、空值、缺失值的数量,以及最小值、
最
大值、值域,还有总和。
若
desc=TRUE
(同样也是默认值),则计算中位数、平均数、平均数的标准误、平均
数置信度为
95%
的置信区间、方差、标准差以及变异系数。
若
norm=TRUE
(不是默认的),则返回正态分布统计量,包括偏度和峰度(以及它们
的统计显著程度)和
Shapiro
–
Wilk
正态检验结果。这里使用了
p
值来计算平均数的置信区
间(默认置信度为
0.95
:
例:
library(pastecs)
stat.desc(mtcars[vars])
5
、
describe()
:
psych
包
计算非缺失值的数量、
平均数、
标准差、
中位数、
截尾均值、
绝对中位差、
最小值、
最大值、
值域、偏度、峰度和平均值的标准误