- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据处理技术在录取分数线预测中应用研究
大数据处理技术在录取分数线预测中应用研究
摘要: 针对传统预测模型在高考分数线预测方面精度不高的问题,在分析出高考分数线的分布规律及主要影响因素后,运用主成分分析法对影响因素降维并归一化数据,建立高考分数线神经网络模型,并运用BP反向传播算法进行学习,计算出最优权值。以西安工业大学为例,用此神经网络对录取分数线进行预测,给出预测结果的精度分析,结果表明了该分数线神经网络模型有效地提高了分数线预测精度,为高考分数线的预测以及学生志愿的填报提供了参考依据。
Abstract: In view of the low precision of college entrance examination scores prediction by traditional forecasting model, the distribution rule and the main influence factors of the college entrance examination scores are analyzed, after that the principal component analysis method is used for the dimensionality reduction of influence factors and data normalization, the college entrance examination scores neural network model is established, and the BP back propagation algorithm is learned to calculate the optimal weights. Taking the Xian University of Technology as an example, the neural network model is used to predict the scores and obtain the accuracy analysis of the prediction result. The results show that the neural network model can improve the prediction accuracy of the score line and provide reference for the forecast of college entrance examination scores and the intention for university.
关键词: 数据挖掘;分数线预测;BP神经网络;应用
Key words: data mining;fractional line prediction;BP neural network;application
中图分类号:TP39 文献标识码:A 文章编号:1006-4311(2017)34-0200-02
0 引言
预测是数据挖掘中重要的任务之一。目前大部分的预测研究集中在销售量预测及股票预测上,一般都带有盈利性,而针对分数线这类公益性的预测研究却很少,预测方法也均为传统的预测方法。如何采用适当的模型预测分数线,进而为考生填报志愿提供科学的参考依据是一个问题。传统的预测模型主要有线性回归预测模型、灰度预测模型等,然而在实际中,分数线的影响因素复杂,传统的预测模型并不能较好地拟合原始数据,导致预测的结果精度较低。近年来,随着机器学习技术的不断发展,出现了基于支持向量机、人工神经网络等方法的预测模型。神经网络(neural networks,NN)是由大量的、简单的处理单元(称为神经元)广泛地互相连接而形成的复杂网络系统,它反映了人脑功能的许多基本特征,是一个高度复杂的非线性动力学习系统,能够精确描述非线性系统的变化规律,成为各个领域的主要预测方法。本文将分步骤详细介绍分数线神经网络模型的建立过程,给出预测模型的精度分析。
1 模型可行性分析
分析收集的高考分数线数据,发现存在众多影响分数线的因素,对收集到的因素进行降维处理。观察数据其分布规律,发现该分布没有较好的函数进行拟合,而三层神经网络能够以任意精度逼近任何的非线性连续函数,因此采用神经网络模型来进行拟合并对平均分数线进行预测是可行的。(图1)
2 分数线神经网络建立过程
2.1 输入输出确定
在使用神经网络模型进行分数线预测时,将学校、招生省份作为筛选项,对输入变量个数进行降维,确定输入变量为年份、招生专业、招生人数,将平均分做为输出变量,对于最高分数线与
原创力文档


文档评论(0)