- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于数据挖掘的校园社交网络用户行分析毕业设计论文
1 绪论
1.1 选题背景
社交网络,简称SNS(social network service)在Web
图1-1 社交网站发展时间表
1.2 研究意义
社交网络的流行不仅带来了信息传播技术的革命性变革,并且一步步改变着人们的生活方式、思维方式等,对于社交网络的研究也不断深入。但目前对于社交网络的主体——网络用户的行为研究仍然比较冷门,主要研究都偏向于网络用户行为研究,很少有专门对于社交网络用户行为的分析化。目前,社会科学对网络行为的研究,主要集中在以下议题:
作为行为场域的网络空间的社会特性
网络行为及其影响因素
虽然以上研究都已比较深入,但大多的都从社会学角度切入研究宏观
网络用户行为,内容与社交网络契合较少并偏向理论化,方法也大多采用问卷调查等主观性较强的方式,很少有通过技术手段采集客观数据并通过软件分析等方式进行研究的文献。而本文则通过网络爬虫采集相关数据,并通过数据分析软件Weka对采集数据进行数据挖掘,通过数据寻找社交网络用户行为及其影响因素,可以说是从一个比较新颖的角度分析了社交网络用户行为。如果能够有效的提取社交网络中的各种数据并对用户行为、群体特征等进行分析,掌握用户的行为模式及其影响因素,不仅能够帮助网站运营商全面掌握用户需求从而提供更好的服务和产品,还能够帮助营销商更好地了解受众群体和信息传播模式进而采取更有效的网络营销和推广手段。
1.3 论文主要研究内容及组织结构
1.3.1主要研究内容
本论文研究内容主要包括一下三个方面:
社交网络及社交网络用户行为
该部分主要是为最终通过分析软件对社交网络用户行为进行总结做好理论基础准备。主要对社交网络概念产生、发展过程进行阐述。并对社交网络更加具有WEB2.0时代的特点进行描述。最后对一般社交网络用户行为动机进行分析。
数据挖掘中的聚类分析
这一部分主要对数据挖掘的聚类分析的定义、分析过程以及主要分析
手段进行描述,并分析各聚类方法优缺点,最后通过根据收集所得数据特征选取合适的聚类分析方法
数据采集技术——网络爬虫
该部分主要确定所要爬取的网页内容,并根据网站HTTP协议与网页
行为特征制定定向网页爬虫方案,然后通过python语言实行具体编码。编码过程主要分为两步,首先通过使用Wireshark抓包后使用python中的urlllib库构造目标网站可识别HTTP协议,然后通过设计正则表达式进行数据提取。
1.3.2论文组织结构
论文第二章主要讨论了社交网络定义与特点,并对一般社交网络用户行为动机进行分析。同时对数据挖掘中的聚类分析定义、过程以及主要方法进行描述,阐明了本文所涉及的理论基础。
论文第三章对于如何通过网络爬虫技术进行数据采集进行了说明。首先介绍了网络爬虫技术的原理与URL存在形态,然后分析了如何制定定向网络爬虫,最后说明了本次网络爬虫程序编码所解决的难题与部分具体代码。
论文第四章对所收集数据进行预处理,并通过Weka数据挖掘软件对数据进行聚类分析,并对所获结果做出解释。
论文最后对整个研究过程进行总结并分析了所存在的不足之处以及对未来进一步研究的展望。
2 关键技术和理论基础综述
2.1 社交网络
2.1.1 社交网络的概念
社交网络一词最早是1954年由J. A. Barnes 首先使用。一个社交网络的大小最大约为150人左右 (Dunbars number)[3],平均大小约为124人左右 (Hill and Dunbar, 2002),它是指社会行动者及其间关系的集合,在上世纪90年代之前这一词语主要在管理学、社会学等领域应用。
但是随着互联网的发展以及六度空间理论和邓巴数字等理论的兴起[4],社交网络逐渐被赋予了新的定义,首先出现的是网络社交。网络社交是伴随着电子邮件的出现产生的,它解决了信息点对点的传送。而BBS则把网络社交又向前推进了一步:从单纯的点对点交流的成本降低,推进到了点对面交流成本的降低。随后产生的即时通信(IM)和博客(Blog)更像是前面两个社交工具的升级版本,前者提高了即时效果(传输速度)和同时交流能力(并行处理);后者则开始体现社会学和心理学的理论——信息发布节点开始体现越来越强的个体意识,因为在时间维度上的分散信息开始可以被聚合,进而成为信息发布节点的“形象”和“性格”,随着网络社交的悄悄演进,一个人在网络上的形象更加趋于完整,这时候符合我们现在定义的社交网络出现了。
现在社交网络也被称作社交网络服务(Social Network Service),简称SNS,也就是社交+网络+应用服务的意思[5]。它通过网络这一载体把人们连接起来,从而形成具有某一特点的团体。社交网络含义包括硬件、软件、服务及应用,狭义上讲它是指建立在真实人际关系基础上的网络平台,是作为现实中的社会团体在互联网上交流的辅助工
您可能关注的文档
最近下载
- 方剂配伍理论智慧树知到课后章节答案2023年下浙江中医药大学.docx VIP
- 数控编程与仿真实训(第5版)——电子全套PPT教学课件.ppt
- 沪教牛津版英语4A-M3U1-In-our-school:animal-school公开课课件.pptx VIP
- 急性荨麻疹-洞察与解读.pptx
- 融资分红合同协议.docx VIP
- 草莓状血管瘤血管瘤-洞察与解读.pptx
- 皮肤念珠菌病念珠菌病-洞察与解读.pptx
- 荨麻疹型药疹药疹-洞察与解读.pptx
- DB5305T 78-2022保山市牛油果园水肥一体化技术规程.docx VIP
- DB53_T 1089-2022鳄梨品种'哈斯'生产技术规程.docx VIP
文档评论(0)