- 1、本文档共51页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
补嘉-大论文v5
独创性声明
学位论文题目: 基于LDA的社交网络链接预测模型研究
本人提交的学位论文是在导师指导下进行的研究工作及取得的研究成果。论文中引用他人已经发表或出版过的研究成果,文中已加特别标注。对本研究及学位论文撰写曾做出贡献的老师、朋友、同仁在文中作明确说明并表示衷心感谢。
学位论文作者: 签字日期: 年 月 日
学位论文版权使用授权书
本学位论文作者完全解西南大学有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权西南大学研究生院(筹)可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。
(保密的学位论文在解密后适用本授权书,本论文:□不保密,□保密期限至 年 月止) 。
学位论文作者签名: 导师签名:
签字日期: 年 月 日 签字日期: 年 月 日
目 录
摘 要 I
ABSTRACT II
第1章 绪论 1
1.1研究背景 1
1.2研究现状 2
1.3主要工作 3
1.4论文结构 4
1.5 本章小结 5
第2章 相关理论和技术 6
2.1主题模型 6
2.2复杂网络 7
2.3社交网络 8
2.3.1社交网络的发展 8
2.3.2 社交网络的定义 9
2.3.3 社交网络的数据表示 10
2.4 社交网络分析 11
2.5链接预测 13
2.5.1链接预测算法 14
2.6 本章小结 16
第3章 基于LDA的社交网络链接预测模型 17
3.1 概述 17
3.2总体框架 17
3.3 形式化描述 18
3.4用户兴趣信息特征提取 20
3.4.1 兴趣主题提取 20
3.4.2 兴趣主题相似度计算 23
3.5社交网络结构信息特征提取 23
3.6分类器的构造 25
3.7模型的可行性和有效性分析 25
3.7.1 可行性分析 25
3.7.2 有效性分析 27
3.8 本章小结 27
第4章 实验 29
4.1 实验平台 29
4.2 数据集 29
4.2.1 数据来源 29
4.2.2 社交网络的构造 29
4.2.3 数据的平衡处理 31
4.3 实验目的 31
4.3 评价方法 31
4.4 实验具体方案 32
4.5 实验结果与分析 32
4.5.1 用户兴趣信息特征 32
4.2.2 网络拓扑结构特征 34
4.2.3 结果分析与比较 34
4.6 本章小结 36
第5章 总结和展望 37
参考文献 39
致 谢 43
攻读硕士学位期间公开发表的论文 44
基于LDA的社交网络链接预测模型研究
计算机软件与理论专业硕士研究生 补嘉
指导教师 唐 雁 教授
摘 要
随着Web2.0技术的不断发展,基于社区的服务,如Wikipedia、 Flickr和Facebook等越来越流行。在社区中,人们可以寻找和上传自己喜爱的图片,可以与社区中的其他用户进行链接,成为朋友。社交网络是依靠人与人之间的朋友关系组织在一起的系统,是现实人际网络的子集。社交网络用户数量的急剧增加,给网络中用户关系、用户信息等数据的挖掘带来了巨大挑战。利用用户节点的属性信息、社交网络的拓扑结构特征等预测用户节点对之间是否存在朋友关系链接,便是其中一个研究热点。
现有的社交网络链接预测算法,如CN算法[1]、AA算法[2]、katz算法[3]等,主要关注社交网络中用户节点对之间的拓扑结构相似特征,缺乏对其属性信息之间潜在语义关系的重视,链接预测的精度不高。此外,在社交网络中,用户的兴趣信息数量巨大,如果直接对每个用户的每个兴趣进行语义关系分析,则需耗费大量时间。针对以上问题,本文引入主题模型、潜在迪里克雷分布模型(LDA, Latent Dirichlet Allocation),首先利用LDA模型对用户节点对之间的兴趣信息进行建模,提取社交网络用户兴趣信息的主题,比较主题之间的语义相似度,这与直接对每个用户的兴趣信息进行分析相比,能够在捕获信息的潜在语义关系的同时,有效降低计算时间复杂度。其次,把复杂网络中的网络资源分配算法RA(Resource Allocation)用来对社交网络的结构信息进行特征提取。然后,通过构造分类器,利用有监督学习框架综合语义特征和拓扑结构特征进行社交网络链接预测。
通过在真实的社交网络LiveJournal数据集上进行实验,与现有的链接预测算法比较,结果证明,本
您可能关注的文档
- 英语-天气课件.ppt
- 获得教养的途径--.ppt
- 营养学基础——脂肪、碳水.ppt
- 营改增对金融业未来发展问题探究.pdf
- 营养粥店创业计划书ppt.ppt
- 董丽清——移项.ppt
- 董明哲--渗流物理--Topic 3 Wettabillity.pdf
- 董明哲--渗流物理--Topic 5 Steady state two phase flow.pdf
- 董雪 《装在套子里的人》.ppt
- 营造温馨家园,感恩母亲深情-ppt.ppt
- 浙江衢州市卫生健康委员会衢州市直公立医院高层次紧缺人才招聘11人笔试模拟试题参考答案详解.docx
- 浙江温州泰顺县退役军人事务局招聘编外工作人员笔试备考题库及参考答案详解一套.docx
- 江苏靖江市数据局公开招聘编外工作人员笔试模拟试题及参考答案详解.docx
- 广东茂名市公安局电白分局招聘警务辅助人员40人笔试模拟试题带答案详解.docx
- 江苏盐城市大丰区住房和城乡建设局招聘劳务派遣工作人员4人笔试模拟试题带答案详解.docx
- 浙江舟山岱山县东沙镇人民政府招聘笔试模拟试题及参考答案详解1套.docx
- 最高人民检察院直属事业单位2025年度公开招聘工作人员笔试模拟试题含答案详解.docx
- 浙江金华市委宣传部、中共金华市委网信办所属事业单位选调工作人员笔试备考题库及答案详解1套.docx
- 广东深圳市党建组织员招聘40人笔试模拟试题及答案详解1套.docx
- 江苏南京水利科学研究院招聘非在编工作人员4人笔试模拟试题及参考答案详解.docx
最近下载
- 《中国结核病预防控制工作技术规范(2020年版)》.PDF VIP
- 2023年北京市中考英语真题(含答案) .pdf VIP
- 南通大学2023-2024学年《病理学》期末考试试卷(A卷)附参考答案.docx
- 胸部损伤-教学课件.ppt VIP
- 某银行数据中心搬迁整体实施方案.pdf VIP
- 麦肯锡中国银行业CEO季刊(2020年秋)-麦肯锡-224页正式版.pdf VIP
- 国家公务员录用考试体检标准.doc VIP
- 入党申请书时事政治精选五篇.docx VIP
- 农村公路安全生命防护工程监理规划49943.doc VIP
- 高中英语3500词【打印版】乱序版3500词汇(带音标120页).pdf VIP
文档评论(0)