- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
指数分布随机图的进步(p *)模型应用到一个大型社交网络
史蒂文·m·Goodreau华盛顿大学人类学和中心的部门研究人口与生态
文摘
最近的进步统计网络分析基于指数分布随机图的家庭
(ERG)模型进行推理的能力有了很大的提高在大社会的依赖
2002年2002年网络(Snijders,帕蒂森和知更鸟,Handcock 2002 Handcock 2003 Snijders et al。
2006年,猎人et al . 2005年,Goodreau et al .,2005年以前的论文这个问题)。本文应用
先进的模型参数化和计算算法的考试结构中观察到一个青少年的友谊从纵向网络1681年的演员青少年健康研究(AddHealth)。ERG的社会网络结构模型适合使用R包statnet及其充分性通过比较模型的预测与评估高阶网络统计观测数据。这种友谊网络的常用的马尔可夫模型的依赖导致的问题简并度的讨论Handcock(2002、2003)。另一方面,模型参数化介绍Snijders et al(2006)和猎人和Handcock(2006)避免退化和提供
合理的适合的数据。只是程度模型无法很好地捕捉观察网络结构;
那些做得最好包括条款都对外源性属性(等级和异构混合
自我报告的种族)以及内生集群。网络模拟模型
很大程度上符合观测网络在多个高阶网络统计数据,包括
三角形的数量,规模最大的组件,整体可达性、分布
测地距离、程度分布和共享伙伴分布。适应的能力
这样的模型对下属大型数据集以及推理过程生成
网络是一个重大进步领域的统计网络分析。
指数分布随机图(ERG)类第一次被提出作为一个社会方法模型网络结构几乎二十年前(1986年弗兰克和施特劳斯),基于工作空间统计(Besag 1974)。建模类非常一般,因此在理论上能够捕捉各种经验的结构网络,允许进行统计推断的结构。然而,大多数从事这个领域的工作
都集中在一个小的模型规范,最常见的马尔可夫图吗弗兰克和施特劳斯(1986)。最近的研究表明,这些常用的模型规范事实上并不适合捕捉过程潜在的许多经验网络,由于模型退化的问题(Handcock 2002,2002)。简并度可以被描述在短暂的现象似乎可以合理的模型
是这样一个坏mis-specification观测数据集作为观测数据几乎呈现
不可能在模型。相反,社会进程模型封装的产量网络(如全部或空图,定性相异的观察
数据和事实上实质上无趣的。简并可以更详细的讨论在知更鸟et al .(2006 b)。
它是合适的,它可能没有证明这样进步的障碍。在其他
领域,差拟合模型通常可以帮助完善知识的数据,分析的
模型成功地获取观测数据和失败可以帮助点的方法
后续的改进模型。ERG的模型,但是,最大的可能性
估计模型参数配合使用马尔可夫链蒙特卡罗(采样程序,
和简并事实上经常阻止模型估计融合在有限的参数
估计。使用近似替代技术,如MPLE估计(施特劳斯
和1990年Ikeda)不解决这个问题,而只是隐藏它。缺乏这一事实
收敛性还可以获得各种特性的模型拟合结果算法不能帮助
很重要。总的来说,这些问题解释ERG的缓慢的应用模型来实证
网络分析到目前为止,尽管他们的潜力。
以前的论文这个问题提供了一个介绍ERG建模方法
(罗宾斯et al . 2006年),研究更深入地退化,阻碍了背后的问题
这些模型的应用(罗宾斯et al . 2006 b),并提供可能的解决方案
(罗宾斯et al . 2006 b,亨特2006)在本文中,我们的目标是应用这些发展
一大组( 1600年演员)的网络数据展示他们在进行实际应用
推理在复杂的依赖关系结构。
数据集:添加卫生学校组42
我们这里分析的数据集是一个集从纵向研究的学校
青少年健康(AddHealth)。AddHealth是一个分层校本的样本
7 - 12年级的学生。以广泛的问卷调查对个人特征,如
在友谊网络模块。学生们提供了一个清单所有学生名单
在学校的名字和独特的ID号,并要求列出五个最好的ID
男性和5个等级次序最好的女性朋友。学生们自由提名少于五个
的。他们也可以提名的朋友没有在学校(通过一个特殊的
代码)或在学校,但不包括在名单上。这里的数据集包含两个
独立学校,大型公立学校多种族城市南部,一个包含
高中生(我们称之为高中)和包含成绩7 - 9日(另一所学校
初中),担任高中的支线。每个学校的学生
提供的花名册,并允许可供选择。进一步的信息
的设计研究中可以找到Resnick et al。(1997)和尤迪Bearman(1998)
和/projects/addhealth。
这一分析,我们认为只有那些演员都完成了调查,
名单(n = 1681)。一个额外的489名学生的名单,但没有调查,
在参加调查的158名学生,但没有
文档评论(0)