- 2
- 0
- 约2.18千字
- 约 4页
- 2017-06-08 发布于北京
- 举报
改进的k均值算法在大学生科技创业活动研究中的应用.doc
改进的k均值算法在大学生科技创业活动研究中的应用 摘要:对大学生科技创业活动研究的目的是为了深入挖据大学生潜力,为其提供良好的大学生科技创业环境。采用数据挖据思想建立科技创业活动研究模型,利用模型帮助学生对创业愿望进行测评,挖掘未发现的创业潜力,辅助自己的创业选择,同时对就业环境的创建起到辅助作用。 关键词:大学生科技创业;数据挖掘;聚类分析;k均值算法 中图分类号:TP312文献标识码:A文章编号:1座机电话号码(2012)00座机电话号码 1创业活动研究模型 本文对创业活动的研究,主要采用聚类对采集的信息进行挖掘处理。 假设考察创业者n项指标,则样本集X X1,X2,…,Xn ,可以用n维向量描述样本,即:Xi Xi1,Xi2,…,Xin ,其中i 1,2,…,m。创业活动研究模型如图1所示。 样本点Xij来自于调查Web上的学生填写的调查信息,对于学生创业者来说,主要想知道自己输入的一些具体信息,得知与之相匹配的创业特征,对于创业环境决策者来说,则可以根据特征分类库设置相应的政策,为创业者创造良好的环境。 样本数据预处理的目的是标准化数据,清除垃圾数据,删除与挖掘无关的样本属性内容。经过预处理后的样本数据,就能进行数据聚类分析。 2数据样本聚类分析 聚类是将数据集中在某些方面相似的数据成员进行分类组织的过程,是一些数据实例的集合,集合间的数据元素彼此相似而区别其它集合
原创力文档

文档评论(0)