R语言互联网的数据挖掘应用论文报告.docxVIP

R语言互联网的数据挖掘应用论文报告.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE 2 此处为论文中文题目,要求居中填写主标题不超过24个汉字;可加副标题(副标题前加破折号),副标题与主标题间空一行的位置 此处为论文中文题目,要求居中填写 主标题不超过24个汉字;可加副标题(副标题前加破折号),副标题与主标题间空一行的位置 主标题:黑体,小二,居中 副标题:楷体_GB2312,四号,居中 阅后删除此文本框。 R语言在互联网时代的数据挖掘应用 团队成员 学 号 指导教师 学 院 专业名称 班 级 2019年6月 目录 TOC \o 1-3 \h \z \u 摘要 3 一、 绪论 4 二、 数据收集 5 2.1数据预处理 5 2.2数据挖掘的定义 5 2.3互联网用户数据的聚类分析算法研究 5 2.4人工神经网络 6 2.4.1神经网络概述 6 2.4.2神经网络特点 8 三、 聚类分析及R语言的实现 8 3.1聚类分析基本概念 8 3.2 R语言的基本概念 9 3.3基于k-means算法的R语言实现 10 四、 实证分析 12 4.1数据分析的基本方案 12 4.2决策树 13 4.3 网络数据收集 15 五、结论 16 参考文献: 16 摘要 近几年来随着的发展,社交网络作为的有形载体也实现了巨大的成长。伴随社交网络发展壮大的,一方面是社交网络的用户群,不同地域、性格和特质的用户群展现出了差异化的需求另一方面是大大小小的社交网站,他们如雨后春笋般出现,开辟了硝烟弥漫的网络战场。面对差异化的用户群体和用户需求,如何细分市场识别并提供差异化的服务,以帮助企业在激烈的竞争中保持老用户,发展新用户,这是本文的主要论题。本文围绕社交网络理论和客户细分理论的研究,运用数据挖掘工具中的聚类和决策树算法,对社交网络的客户细分进行了深入的探讨并最终得出可指导实践的社交网络客户细分规则。 该文对数据挖掘技术在网络教学中的应用进行了分析与研究。首先对网络学习行为及特征、对网络教学中存在的问题等进行了归纳分析。然后,基于存在的问题,在深入理解数据挖掘理论的基础上,对采用关联分析、决策树分析、聚类分析等多种数据挖掘方法,对网络教学平台及相关教学数据进行分析的过程进行了探讨 关键词: R语言 模型的实现 聚类算法 数据挖掘 决策树分析 绪论 随着近年来电子商务、社交网站、移动终端应用开发等行业的兴起,企业对于用户基本数据、行为数据、网络痕迹数据等信息的掌握逐渐成为其在信息领域的核心竞争力,“用数据说话”、“用数据决策”等已经成为各大企业倡导的未来发展基石。然而,传统的数据全样抽取、数据的随机抽样等分析统计方法不仅时效性差,不适应对实时数据的处理,且由于分析手段的局限性,预测结果数据往往存在有效性差的问题,因此,如何利用海量的数据挖掘出有价值的信息,对于企业来说是挑战,也是机遇。 中国人口显然不太可能再出现急剧增长了,所有互联网公司都必须正视一个事实:“增量市场”一去不复返了,现在是“存量市场”,用户数量和结构都趋于固化,未来将是博弈论所谓的“反复博弈”时期,这不仅是互联网公司与用户的“反复博弈”,也是互联网公司之间的“反复博弈”。既然流量增长的势头结束了,单位流量必然会变贵,获取新用户的成本必然会提高。此外,新用户变成老用户之后,口味会更加挑剔,尝试新鲜事物的倾向会下降。对于移动应用来说,不但新用户更难获得,老用户的留存率也成为难题。运用好R语言的数据挖掘来分析用户习惯,对于互联网时代的企业有巨大的帮助。 (中国社交网络人数增量) 数据收集 2.1数据预处理 鉴于互联网行业的业务分布范围广,业务数据分散在各个公司里面的BOSS系统的不同模块中,所以我们只能先依据数据流量产品营销的分析目的进行数据的预处理,在互联网上以关键字来进行数据的提取并且将其集中到到数据库。再进行下一步的算法实证等。 2.2数据挖掘的定义 数据挖掘的功能数据挖掘的功能是指数据挖掘任务中要找的任务类型。数据挖掘任务一般可以分两类描述和预测。描述性挖掘任务刻画数据库中数据的一般特性预测性挖掘任务在当前数据上进行推断,以进行预测。具体来讲数据挖掘的功能主要包括以下几个方面: 第一,通过将数据进行一定程度的区分和特征化的整理,以图表曲线等形式给出相应类或概念的描述。 第二,找出数据通常是事务数据库中的数据频繁出现的模式以及彼此之间存在的人们感兴趣的关联和相关模式。 第三,对原始数据进行分类以及根据历史数据对新数据进行预测。其中典型的分类方法包括决策树分类等。 以下将着重介绍本文后续研究将运用的聚类分析和分类和预测决

文档评论(0)

新起点 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档