- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
研究生学位论文选题报告
研 究 课 题 等密度线聚类算法研究
研 究 生 姓 名 颜斌
所在教研室名称 统计学教研室
攻 读 学 位 硕士学位
导 师 姓名职称 邓光明 教授
论 文 工 作 的
起 止 时 间 2015.9-2016.4
桂林理工大学研究生部制
一、选题依据(选题来源,研究意义,国内外研究现状、水平和发展趋势)
课题来源:
自选课题。
研究意义:
随着信息技术的发展, , , , , , 。 , 。?s和Rényi建立了ER随机图理论,一直被很好的应用于复杂网络中,在20世纪末,由Watts和storgatz提出的小世界网络模型和Barbaasi和Albert提出的BA无标度网络模型可以看做是复杂网络研究新纪元开始的标志,随后在此基础上提出了许多更切实际的网络模型如:小世界网络模型、加权网络模型、局域网络模型等。抽样技术是指从研究对象的总体中抽取一部分单元作为样本,对样本进行分析以获取总体信息的方法。自1895年挪威统计学家凯尔提出抽样调查以来,经过一个世纪的发展,抽样技术日趋成熟和完善,形成了以简单随机抽样、分层随机抽样、系统抽样和整群抽样为核心的经典抽样理论。然而两个领域的结合相对较晚,由于所研究的网络规模越来越大,受到技术和成本的约束,21世纪初国内外有许多学者开始将抽样技术用于复杂网络,用样本网络来推断总体网络的拓扑性质。
国外的复杂网络抽样研究比较成熟,提出了许多经典的抽样方法,包括随机抽样、滚雪球抽样、广度优先算法抽样、随机游走、加权随机游走等。
在理论研究方面,Palmer等(2002)提出在估计节点距离为h的节点数函数N(h)时,ANF算法比滚雪球等其他抽样方法更有效;Leskovec等(2005)对于样本网络优劣提出使用致密化法来筛选效果不佳的样本子网络。
在模型应用方面,Stumpf等(2005)针对3类网络包括经典随机网络(ER网络)、指数随机网络和无标度网络,考察了网络度分布在随机抽样下的变形情况,但仅考虑了节点幂率度分布这一单一结构特征在抽样下的变形情况。
在实际应用方面研究成果比较多,Haewoon Kwak等(2006)使用滚雪球抽样法对韩国最大社交网站Cyworld网进行抽样,比较了不同抽样率对度分布、度相关性、同配性和聚类系数等网络结构特征估计效果的影响,总结出为了获得更好的估计效果,不同网络结构特征量需要不同最小抽样率的结论,但这一结论仅适用于作者所研究的Cyworld网,对于其它网络不一定适用;Lee等(2006)使用节点抽样、连边抽样、滚雪球抽样对模拟的BA无标度网络以及3个实际网络进行抽样,计算了样本网络的度分布、平均路径长度、中介中心性分布、同配性和聚类系数等网络结构特征,得到了对于同一个网络,不同抽样方法所得的结果大不相同的结论,但相比于Haewoon Kwak的研究,Lee所研究网络的规模较小;D.Stutzbach等(2006)将MRWB无偏抽样法用于对等网络(P2P)中,得到的样本网络估计效果比其他抽样方法的估计效果更好;Krishnamurthy等(2008)在对Twitter网的研究中使用了MHRW无偏抽样法,也得到了很好的估计效果;M.Gjoka等(2010)在对Facebook网络进行抽样研究时,发现MHRW和RWRW抽样法比传统的BFS和RW的估计效果更佳,并使用MHRW抽样法所得的样本网络估计了Facebook网络的很多重要网络结构特征量。
国内的复杂网络抽样研究起步较晚,且大多都是针对模拟网络或实际网络的应用。
在模拟网络应用方面,杨波等(2007)用中枢抽样法、随机抽样法和边缘抽样法对CNN网络模型进行抽样分析,计算了样本网络的幂率度分布、分层模块性、节点度相关性,取得了不错的估计效果,但在抽样过程中需要知道完全网络的度分布,这一信息在实际应用中几乎是不可能得到的;随后,杨波等(2013)还用了随机抽样法、中枢抽样法、链式抽样法和中枢链式抽样法对5种网络(ER随机图、WS小世界网络、BA无标度网络、DMC网络和CNN网络)进行了抽样,研究不同抽样方法对不同网络生长机制的影响,得到了针对不同的网络需要选择恰当的抽样方法的结论;邓雪莲等(2008)提出了一种基于抽样技术的算法ABS,通过分析从大型复杂网络中抽样所得到的样本网络,推导出可靠性度量参数,同时还给出了这些参数的Bootstrap置信区间,最后总结出ABS算法在估算大型复杂网络的可靠性度量参数方面是有效的;齐灿等(2012)针对无标度网
文档评论(0)