心理测量中的数据挖掘.ppt

  1. 1、本文档共109页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
本研究产生了29个叶子结点, 即29条分类规则。 以适应性总分为例, 列举其产生的八条规则。 规则1: IF 留学生对服务模式的态度=“认同” AND 留学生性格外向=“是” AND 对教学管理的态度=“不认同” THEN 总适应(60.0%)=“适应”。 规则2: IF 留学生对服务模式的态度=“认同” AND 留学生性格外向=“是” AND 对教学管理的态度=“认同” AND 对公德意识的态度=“认同” THEN 总适应(86.3%)=“适应”。 规则3: IF 留学生对服务模式的态度=“认同” AND 留学生性格外向=“是” AND 对教学管理的态度=“认同” AND 对公德意识的态度=“不认同” THEN 总适应(66.2%)=“适应”。 规则4: IF 留学生对服务模式的态度=“认同” AND 留学生性格外向=“否” THEN 总适应(50.5%)=“不适应”。 规则5: IF 留学生对服务模式的态度=“不认同” AND 留学生性格外向=“是” AND 对食堂环境的态度=“认同” THEN 总适应(63.3%)=“适应”。 规则6: IF 留学生对服务模式的态度=“不认同” AND 留学生性格外向=“是” AND 对食堂环境的态度=“不认同” THEN 总适应(69.7%)=“不适应”。 规则7: IF 留学生对服务模式的态度=“不认同” AND 留学生性格外向=“否” AND 对教师形象的态度=“认同” THEN 总适应(74.5%)=“不适应”。 规则8: IF 留学生对服务模式的态度=“不认同” AND 留学生性格外向=“否” AND 对教师形象的态度=“不认同” THEN 总适应(93.8%)=“不适应”。 从总适应性模型可以看出, 服务模式是其最佳预测变量。 八条规则结果显示, 如果留学生对服务模式认同, 虽然还受到其他因素的影响, 仍然普遍表现为适应; 如果留学生对服务模式不认同, 则虽也受到其他因素的影响, 基本都会表现出不适应。? 外向性是其第二个较重要的影响因素, 教学管理、教师形象、公德意识和 食堂环境也都对留学生的总适应性 产生不同程度的影响。 由此可见 决策树不仅能获得影响因素间的关系, 并且能够获得影响因素与适应性水平 之间的强因果关系。 而且它也类似于关联规则方法, 能够得出因素在各个水平上的预测概率, 并对因变量进行分类。 数据挖掘的方法很多很多, 这里只是介绍了 关联规则和决策树的方法, 它们可以看作是心理统计的补充, 从心理测量数据获得更多信息。 谢 谢! 于是可计算属性“年龄”的信息增益为: 采用类似的方法,可以计算属性“学生”的信息增益为: 采用类似的方法, 还可以计算属性“收入”、“信用等级”的信息增益, 然后从所有属性中找到信息增益最大的属性,将它作为划分的对象。 3.2.4决策树的剪枝 如果建立的决策树的构造过于复杂,则对应的知识规则将是难以理解和应用的, 因此对于决策树的建立,不仅需要考虑分类的正确性, 还要考虑决策树的复杂程度,即在保证一定的分类正确率条件下,决策树越简单越好。 最常用的决策树简化方法就是剪枝, 包括预剪枝与后剪枝。 预剪枝是预先设定某一相关阈值,决策树达到该阈值后就停止树的生长。 该方法比较简单,但预先指定阈值相当困难。 后剪枝是对已经建立的决策树 以一定的标准进行剪枝, 使决策树得以简化, 但仍具有一定的分类正确率。 CART算法采用后剪枝法。 具体方法为: 针对未经剪枝的决策树T,运用算法将其某一个或几个子树删除,得到新的决策树 j,然后对于多种不同剪枝的结果 j进行比较,找出最好的剪枝形式。 剪枝过程中删除的子树将用叶结点代替,这个叶结点所属的类 用这棵子树中大多数训练实例所属的类来代替。 4、来华留学生跨文化适应性测量的数据挖掘 我们通过问卷调查得到 学校环境影响因素、 社会文化影响因素、 个性心理特征 与适应性水平的数据。 适应性和影响因素的关系: 关联规则方法; 根据适应性对留学生分类: 决策树方法。 4.1关联规则提取 4.1.1数据准备与参数设定 对于来华留学生跨文化适应性的 影响因素包括四方面21项: 人口统计学因素: (1)按文化圈分类的留学生国籍 (2)按GDP分类的留学生国籍(3)所在地(4)性别(5)年龄 (6)汉语水平 (7)学生类别(8)所学专业 (9)已来华时间 (10)来华前已学汉语的时间 (11)留学生来华前对华了解 (12)来华经费; 学校环境影响因素:(1)教师形象 (2)教学管理(3)食堂环境 (4)学习

文档评论(0)

kxiachiq + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档