- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
兰 州 商 学 院
本科生毕业论文(设计)
开 题 报 告论文(设计)题目:基于数据挖掘的数据预处理方法研究
学院、 系:信息工程学院专 业 (方 向): 信息管理与信息系统年级、 班:2010级信管2班学 生 姓 名:杨士晓指 导 教 师:王玉珍年 月 日摘要:对于数据分析而言,核心是数据。但是并不是所有的数据都是有用的,大多数数据是参差不齐的,概念层次不清的,数量级不同的,这就给后续的数据分析和数据挖掘带来的极大的麻烦,甚至导致错误的结论。所以有必要对数据进行预处理,接着就来讨论下数据预处理技术。通常数据预处理包含四个部分:数据清理、集成和变换、规约以及概念分层。数据预处理方法作为数据挖掘的重要载体和中枢作用,除了可以增加数据分析的精确性之外,还能降低数据挖掘的成本。通过此次对数据预处理方法研究找出数据预处理方法存在的一些问题并提出了解决措施,以便更好地促进数据预处理功能的发挥,使之成为数据挖掘和数据分析良好发展的重要平台。
关键词:数据分析 现状 问题 数据预处理
选题的研究现状国内做数据服务目前存在几点障碍:1. 信息数据安全和规范性差。国外的用户信息保密程度高,数据公司信誉好,市场操作规范。而国内用户信息漫天飞,骚扰电话和短信时时响,导致数据和信息最基础的参与者信任度低,积极性弱。所以,目前数据的真实性、完整性交差,特别缺失的是用户个人信息数据。Nilson Mobile在国外可以与消费者签约,能及时获得消费者完整的个人信息和每月电信消费的各类数据。因此,Nilson Report能给各运营商提供准确的报告,特别是竞争对手的数据信息。2. 数据分布散。随着消费者需求的融合,技术的融合,跨行业的数据信息非常重要。我曾经接触一个案例:宝马公司推广X3系列,其锁定的目标客户群是年轻中高端时尚的白领阶层。因此,其对用户进行画像,希望通过数据公司能找到这类用户。包括:经常使用Apple的系列产品,喜欢旅游,喜欢购买时尚的商品等,这些信息散落在不同的行业,难以完全获取和整合。3.管理层对数据信息的重视程度不足。国内传统行业的公司决策基本上是拍脑袋。老板更多依赖于自己的经验和眼光,对数据信息的认可度还比较差。当然,也由于虚假信息和数据公司太多的缘故。基于目前的状况,关于数据挖掘的数据预处理研究也停滞不前,缺乏资金、领导、人力的支撑,因此可借鉴的文献和案例非常稀少,作为信息管理专业的学生经过大学四年的学习,初步认识到数据预处理在信息时代的重要地位。因此,在专业老师的指导下,开展基于数据挖掘的数据预处理研究的必要性和紧迫性不言而喻,希望能在理论上和实践上,推广预处理技术方法,促进数据信息的新发展和强化企业信息化管理。
选题目的和价值(一)选题的目的
数据分析的快速发展,引起了国内外专家、学者的普遍关注.从搜集的文献资料来分析,目前我国数据挖据的研究,主要集中在Web数据挖掘、电子商务数据研究与应用、基于SAS数据挖掘的应用研究等方面的研究。在这些领域都取得了不少成果。
这些研究大都集中在一个宏观的层面,对中国信息管理而言,只是一个普遍性的研究,而且都集中在数据挖据方面,对于数据挖掘的预处理方法的研究较少;再者对预处理方法如何发展问题上,大多是集中于数据分析现状而提出的措施,没有创新性。
我的论文研究主要目的是为了填补了基于数据挖据的数据预处理方法研究在理论和实践上空白的,为政府、企业、科研提供切实可行的参考措施;并针对预处理方法运作中出现的问题提出具有创新性的解决措施。
(二)课题的理论和应用价值
随着计算机的普及,电子商务得到前所未有的发展,经销商与客户之间通过互联网进行交易,节省了大量的费用和时间.但是在电子商务中充斥着大量的数据,如何从大量的数据中挖掘出有价值的信息,帮助企业制定更好的营销策略是电子商务急需解决的问题.数据挖掘技术是一种商业信息处理技术,主要对商业数据库中的大量数据进行提取,分析和处理,它可以在没有假设的前提下进行挖掘信息,从而可以将数据转化成企业有用的信息.数据挖掘的使用可以为企业节省开支,使电子商务更好,更快的运营
理论上:随着外部互联网营销、电子商务、M2M等的发展,以及内部信息化管理的提升;基于数据信息的管理运营和营销的市场潜力巨大。国内的数据挖掘处在初始阶段,主要还是信息和数据等术的层面,未来应该上升为知识和管理等道的层面,影响企业战略决策、执行和评估。
实践上:1、给国内企业如何发展高效管理自己的数据提供了便捷的方法2、给出了“金融数据挖掘”建设发展的建议和意见3、针对数据预处理方法问题的分析和意见能够促使信息数据安全并向规范化发展,给广大研究者提供进一步研究和深入挖据的平台。
(三)研究的内容
1、通过问卷和访谈的形式对国内几大
文档评论(0)