指数分布随机图进步.docVIP

下载本文档

16
0
约1.29万字
约 14页
2017-09-01 发布于安徽
举报
版权申诉

指数分布随机图进步.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

指数分布随机图的进步(p *)模型应用到一个大型社交网络史蒂文·m·Goodreau华盛顿大学人类学和中心的部门研究人口与生态文摘最近的进步统计网络分析基于指数分布随机图的家庭 (ERG)模型进行推理的能力有了很大的提高在大社会的依赖 2002年2002年网络(Snijders,帕蒂森和知更鸟,Handcock 2002 Handcock 2003 Snijders et al。 2006年,猎人et al . 2005年,Goodreau et al .,2005年以前的论文这个问题)。本文应用先进的模型参数化和计算算法的考试结构中观察到一个青少年的友谊从纵向网络1681年的演员青少年健康研究(AddHealth)。ERG的社会网络结构模型适合使用R包statnet及其充分性通过比较模型的预测与评估高阶网络统计观测数据。这种友谊网络的常用的马尔可夫模型的依赖导致的问题简并度的讨论Handcock(2002、2003)。另一方面,模型参数化介绍Snijders et al(2006)和猎人和Handcock(2006)避免退化和提供合理的适合的数据。只是程度模型无法很好地捕捉观察网络结构; 那些做得最好包括条款都对外源性属性(等级和异构混合自我报告的种族)以及内生集群。网络模拟模型很大程度上符合观测网络在多个高阶网络统计数据,包括三角形的数量,规模最大的组件,整体可达性、分布测地距离、程度分布和共享伙伴分布。适应的能力这样的模型对下属大型数据集以及推理过程生成网络是一个重大进步领域的统计网络分析。指数分布随机图(ERG)类第一次被提出作为一个社会方法模型网络结构几乎二十年前(1986年弗兰克和施特劳斯),基于工作空间统计(Besag 1974)。建模类非常一般,因此在理论上能够捕捉各种经验的结构网络,允许进行统计推断的结构。然而,大多数从事这个领域的工作都集中在一个小的模型规范,最常见的马尔可夫图吗弗兰克和施特劳斯(1986)。最近的研究表明,这些常用的模型规范事实上并不适合捕捉过程潜在的许多经验网络,由于模型退化的问题(Handcock 2002,2002)。简并度可以被描述在短暂的现象似乎可以合理的模型是这样一个坏mis-specification观测数据集作为观测数据几乎呈现不可能在模型。相反,社会进程模型封装的产量网络(如全部或空图,定性相异的观察数据和事实上实质上无趣的。简并可以更详细的讨论在知更鸟et al .(2006 b)。它是合适的,它可能没有证明这样进步的障碍。在其他领域,差拟合模型通常可以帮助完善知识的数据,分析的模型成功地获取观测数据和失败可以帮助点的方法后续的改进模型。ERG的模型,但是,最大的可能性估计模型参数配合使用马尔可夫链蒙特卡罗(采样程序, 和简并事实上经常阻止模型估计融合在有限的参数估计。使用近似替代技术,如MPLE估计(施特劳斯和1990年Ikeda)不解决这个问题,而只是隐藏它。缺乏这一事实收敛性还可以获得各种特性的模型拟合结果算法不能帮助很重要。总的来说,这些问题解释ERG的缓慢的应用模型来实证网络分析到目前为止,尽管他们的潜力。以前的论文这个问题提供了一个介绍ERG建模方法 (罗宾斯et al . 2006年),研究更深入地退化,阻碍了背后的问题这些模型的应用(罗宾斯et al . 2006 b),并提供可能的解决方案 (罗宾斯et al . 2006 b,亨特2006)在本文中,我们的目标是应用这些发展一大组( 1600年演员)的网络数据展示他们在进行实际应用推理在复杂的依赖关系结构。数据集:添加卫生学校组42 我们这里分析的数据集是一个集从纵向研究的学校青少年健康(AddHealth)。AddHealth是一个分层校本的样本 7 - 12年级的学生。以广泛的问卷调查对个人特征,如在友谊网络模块。学生们提供了一个清单所有学生名单在学校的名字和独特的ID号,并要求列出五个最好的ID 男性和5个等级次序最好的女性朋友。学生们自由提名少于五个的。他们也可以提名的朋友没有在学校(通过一个特殊的代码)或在学校,但不包括在名单上。这里的数据集包含两个独立学校,大型公立学校多种族城市南部,一个包含高中生(我们称之为高中)和包含成绩7 - 9日(另一所学校初中),担任高中的支线。每个学校的学生提供的花名册,并允许可供选择。进一步的信息的设计研究中可以找到Resnick et al。(1997)和尤迪Bearman(1998) 和/projects/addhealth。这一分析,我们认为只有那些演员都完成了调查, 名单(n = 1681)。一个额外的489名学生的名单,但没有调查, 在参加调查的158名学生,但没有