跳转到内容

R 编程/计数数据模型

来自维基教科书,开放的书籍,开放的世界

泊松模型

[编辑 | 编辑源代码]

假数据模拟

[编辑 | 编辑源代码]

我们假设 y 服从均值为 exp(1 + 1 * x) 的泊松分布。我们将数据存储在“df”数据框中。

N <- 1000
x <- rnorm(N)
alpha <- c(1,1)
y <- rpois(N,exp(alpha[1] + alpha[2] * x))
df <- data.frame(x,y)
plot(x,y)


最大似然估计

[编辑 | 编辑源代码]

我们使用glm()函数和选项family = poisson来估计这个简单的模型。

fit <- glm(y ~ x, family = poisson, data = df)
summary(fit)

贝叶斯估计

[编辑 | 编辑源代码]

该模型也可以使用贝叶斯方法进行估计,MCMCpack 包中提供了 MCMCpoisson() 函数。

library("MCMCpack")
posterior <- MCMCpoisson(y ~ x, data = df)
plot(posterior)
summary(posterior)

过度分散检验

[编辑 | 编辑源代码]
  • dispersiontest()(AER 包) 提供了等分散检验。

零膨胀模型

[编辑 | 编辑源代码]

参见 zic[1]

双变量泊松回归

[编辑 | 编辑源代码]
  • bivpois 包用于双变量泊松回归。

参考文献

[编辑 | 编辑源代码]
  1. Markus Jochmann (2010). zic: 零膨胀计数模型的贝叶斯推断。R 包版本 0.5-3。 http://CRAN.R-project.org/package=zic
  2. Cameron, A.C. 和 Trivedi, P.K. (1998)。计数数据的回归分析。剑桥:剑桥大学出版社。
  3. Christian Kleiber 和 Achim Zeileis (2008)。用 R 进行应用计量经济学。纽约:施普林格出版社。ISBN 978-0-387-77316-2。URL http://CRAN.R-project.org/package=AER
华夏公益教科书