主成分分析法在大学生上网行为分析中的应用.docVIP

主成分分析法在大学生上网行为分析中的应用.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
主成分分析法在大学生上网行为分析中的应用   摘要:随着大数据时代的到来,大数据分析技术已经在各行各业得到了应用和发展。研究了数据分析技术中主成分分析方法的原理和数据建模方法。以咸阳师范学院大学生上网行为数据为数据源,借助SAS软件中的数据库和分析模块,对数据源进行采集、整理、清洗,建立分析指标,对预处理后的数据从购物、社交、科技等网址类别指标进行主成分分析,得到大学生上网的高峰期和不同类别对大学生上网情况的影响。最后,根据对大学生上网情况的分析提出合理的规划与建议。   关键词:大数据;主成分分析;大学生上网行为数据   中图分类号:G202 文献标识码:A 文章编号:1009-3044(2016)33-0018-03   Abstract: With the advent of the era of big data, big data analysis technology has been applied and developed in all walks of life. The principle of principal component analysis and data modeling methods are studied. Using the students’ online behavior data for data source in XianYang Normal University, using database and analysis module in SAS software, the data source collection, sorting, cleaning and set up the index, and the pre processed data from shopping, social, science and technology. The types of indicators for principal component analysis, University students in Internet the peak and different categories of Internet influence on students, finally put forward the planning and reasonable suggestions for college students.   Key words: big data; principal component analysis; university students Internet behavior data   ?S着互联网的飞速发展,生活在信息时代下的大学生们,自然少不了对于网络的使用。根据中国互联网络信息中心发布报告中的数据,表明网民的规模在迅速增大[1]。为了研究网络对大学生的影响,利用主成分分析方法对大学生上网行为数据进行分析。   主成分分析方法先是由K.皮尔森针对非随机变量引入的,尔后H.霍特林将此方法推广到随机向量的情形,其实际应用十分广泛,比如人口统计学、数学建模、数理分析等学科中,是一种常用的多变量分析方法[2]。SAS作为统计分析的标准软件,被广泛应用于科研,教育,生产和金融等不同的领域,并且发挥着越来越重要的作用[3]。   本文通过研究主成分分析方法的原理和数据建模方法,以我校大学生上网行为数据为数据源,借助SAS软件中的数据库和分析模块,对数据源进行采集、整理、清洗,建立分析指标。并对预处理后的数据在一定时间段的上网人数,从购物、军事、科技、旅游、社交、体育、新闻、学习、音乐、影像、游戏、工具、其他等13个不同类别的网址指标进行主成分分析。通过数据分析得到大学生上网的高峰期以及不同类别对大学生上网情况的影响,最终针对大学生上网情况提出合理的规划与建议。   1 主成分分析方法的数学原理   在实际问题的研究中,往往需要考虑很多因素,由于每个变量彼此之间都存在一定的相关性,导致所得到的观测值所反映的信息在内容上存在重叠,而研究者往往希望变量越少越好,少量的变量所反映的信息量越多越好,主成分分析[4]正是解决了这类问题,是将多个指标化为少数互相无关的综合指标的一种多元统计分析方法。   2 数据预处理   利用主成分分析的降维思想,选取每天24小时作为变量,用主成分分析方法来处理一周中每天的时间段的数据,其分析结果将会为我们找到包含大部分信息的时间段,这样有助于进一步的分析。   2.1 数据预处理   数据源来源于我校大学生上网行为数据,由于原始数据是日志文件,不是数据分析需要的结构化数据。在数据分析之前,需要对数据进

文档评论(0)

yingzhiguo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5243141323000000

1亿VIP精品文档

相关文档