- 1、本文档共57页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
毕业设计基于决策树算法对大学生消费状况的研究
JIU JIANG UNIVERSITY
毕 业 论 文
题 目 基于决策树算法对九江学院
消费状况的研究
英文题目Research on Consumption of
Jiujiang University Based on
Decision Tree Algorithm
院 系 信息科学与技术学院
专 业 信息管理与信息系统
姓 名
班级学号
指导教师
二O一五年五月
摘 要
在大数据时代,数据成为了人们关注的焦点。在我们生活的过程中会产生很多数据。当数据量巨大并且杂乱无章的时候,数据挖掘在处理这些数据中扮演着一个特别重要的角色,我们可以通过数据挖掘技术从海量的数据中挖掘出有价值的信息。近年来,人们开始更多的关注与自己生活有关的数据。大学生在其日常的消费过程中产生的数据量十分庞大。这些数据中蕴含着大量的信息,需要我们去发现。
本文主要研究的是九江学院大学生的宏观消费状况。本文采用了网络问卷调查的方式随机收集了九江学院在校大学生的部分消费数据。我们对收集的数据进行预处理并得到完整可靠的的数据样本,然后把这些数据以表格的形式存储于MySQL数据库中并建立可用的数据源。数据准备工作结束后,使用不同的决策相关的算法对数据建模。本文的目的是基于决策树算法对九江学院消费数据的研究,通过对算法的比较,选择了合适的决策树算法。使用的算法包括C5.0和CHAID。本文把研究目的细分为以下两项:基于决策树C5.0研究九江学院大学生消费状况对学生是否加兼职的影响;基于决策树CHAID研究九江学院大学生消费状况对学生是否能够领取贫困助学金的影响。最后通过相应的决策树算法建立了不同的决策树和规则集,并对决策树和规则集进行了分析与评估。
关键词:大数据,数据挖掘,消费,决策树
Abstract
In the era of big data, data becomes the focus of attention.We will produce a lot of data in the course of our lives .When the data becomes large and unsystematic, data mining plays a particularly important role in dealing with these data , we can mining valuable information from the vast amounts of data through the technology of data mining . In recent years, people start to given more attention on their related data with life .College students produce a huge amount of data associated with the consumption in everyday.We need to find a lot of information in these data.
This paper mainly studies the Jiujiang university studentsconsumption situation.And in this paper,I random collected the date of Jiujiang university college students consumption by using the network questionnaire.We preprocessed the data which we collected and got a complete and reliable data samples,then,we stored the data in the form of a table in the MySQL database and established the available data sources .After the preparation of data ,we used different algorithm decision for data modeling.The purpose of this articl
文档评论(0)