- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于泊松回归某WAP网站游戏频道下载量预测分析
基于泊松回归某WAP网站游戏频道下载量预测分析
摘要:游戏应用作为3G时代手机应用的重头戏已经收到越来越多的关注,游戏频道为手机门户网的收入贡献也是越来越大的。本文结合某WAP网站游戏频道相关数据,依托已有的下载量和收入的数据资源运用泊松回归对此WAP网站游戏未来下载量进行了预测分析,并根据目前整个国内手机游戏市场的发展情况提出一些建议。本文采用的是商业数据,所以数据使用的是原始数据的比例数据,结果仅供参考。
关键词:手机游戏 泊松回归 下载量
■一、 研究背景
在这个信息时代,手机已经成为我们生活中不可或缺的一部分,而随着手机功能的拓展,它能带给我们的已经不仅仅是接打电话的单一功能,随着国家3G牌照的发放,手机游戏市场再度成为业界关注的焦点。目前游戏频道的内容主要是推广由渠道提供商提供的游戏包,无线终端部门提供的游戏内容等。
根据各大WAP门户网站财报显示,在各项手机应用中手机游戏业务营收占比增长迅速,成为营收增长亮点。本文将基于游戏频道相关数据信息对游戏频道进行基础的描述性统计分析,运用泊松回归对240款手机游戏进行基于下载量数据和收入数据的下载量预测,由于游戏频道的游戏下载量的变动与游戏频道的收入变动有较大的相关性,将只对游戏频道的下载量进行预测。
■二、基于泊松回归的下载量预测分析
本方法试图利用各款手机游戏的历史数据,找出影响手机游戏未来下载量的因素,并建立合理的经济计量学模型进行预测,最后根据分析结果提出合理建议。
1、数据来源
随机抽取某WAP网站游戏频道240款手机游戏2月、3月、4月、5月的下载量数据和2月、3月、4月的收入数据。(取10组示例)
2、变量说明
Freq0 自变量 五月份的下载量
Freq1 自变量 四月份的下载量
Freq2 自变量 三月份的下载量
Freq3 自变量 二月份的下载量
Exp1 自变量 四月份的收入
Exp2 自变量 三月份的收入
Exp3 自变量 二月份的收入
使用软件:R2.8.1
3、数据描述
首先,对数据进行描述性分析,按平均水平来说,每个月每款游戏的收入为80-150元,下载量为550-900。以下具体分析看出各个解释变量同因变量之间的关系。
4、数据建模
因变量为频数,因此,采用泊松回归的方法建立模型。
(1)全模型分析
模型建立:λ(x)=β0+β1×freq1+β2×freq2+β3×freq3+β4×exp1+β5×exp2+β6×exp3+ε
pos0=glm(freq0~1,family=poisson())
pos1=glm(freq0~freq1+freq2+freq3+exp1+exp2+exp3,family=poisson())
anova(pos0,pos1)
似然比检验统计量是两个模型的deviance之差,即86313。原假设成立时,它服从自由度为6的卡方分布。模型的整体显著性水平显示该模型高度显著,也就是六个自变量中至少有一个和因变量显著相关。再作方差分析:
library(car)
Anova(pos1,type=III)
可知除了exp3,其余五个变量都高度显著。再对具体的参数估计分析:
summary(pos1)
可以得到如下结论:
A:前五个自变量和因变量高度相关。即五月份的下载量分别与二月、三月、四月的下载量显著相关,与三月、四月的收入显著相关。说明:历史下载量和历史收入对未来的下载量都有较强的预测能力,其中,历史期较长的收入对未来下载量没有影响。
B:这五个自变量的系数不同,影响力不同。其中,收入的影响力很小。即五月份的下载量与前三个月的下载量相关性更大。说明:历史下载量对未来下载量的预测能力高于历史收入的预测能力。
C:对于历史下载量,最近一个月的下载量的系数明显高于另外两个月的系数。即四月份下载量的系数明显高于二月和三月下载量的系数。说明用户最近一个月的行为对未来的预测能力最强。
(2)模型选择
最优模型的选择:在R中根据AIC、BIC进行自动搜索
pos.aic=step(pos1,trace=F)
summary(pos.aic)
pos.bic=step(pos1,trace=F,k=log(length(a[,1])))
summary(pos.bic)
对于本文,AIC和BIC得到了相同的结论。它们都认为,除了exp3,有其他四个变量的模型就是最优的模型。
λ(x)=β0+β1×freq1+β2×freq2+β3×freq3+β4×exp1+
文档评论(0)