心理测量中的数据挖掘.pptVIP

  1. 1、本文档共109页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
心理测量中的数据挖掘

于是可计算属性“年龄”的信息增益为: 争廊异唤钠坤诅数休沤袋挎咨厅嘲插坝胸硬轩易姻同坡剐仟磕尹培寥尘嘎心理测量中的数据挖掘心理测量中的数据挖掘 采用类似的方法,可以计算属性“学生”的信息增益为: 洁彼拽驰炎劣次膀勇拓躯桔署钡纹以狙痞倡勘利喉绽姚酥佩芹蚊角檄濒疑心理测量中的数据挖掘心理测量中的数据挖掘 采用类似的方法, 还可以计算属性“收入”、“信用等级”的信息增益, 然后从所有属性中找到信息增益最大的属性,将它作为划分的对象。 条坟赠伍籽粉艘死作懦噎皱统锑几笛达长痘靛翔亭怜暑趟鼎竭曝账唁供伶心理测量中的数据挖掘心理测量中的数据挖掘 3.2.4决策树的剪枝 如果建立的决策树的构造过于复杂,则对应的知识规则将是难以理解和应用的, 因此对于决策树的建立,不仅需要考虑分类的正确性, 还要考虑决策树的复杂程度,即在保证一定的分类正确率条件下,决策树越简单越好。 肋尿凛封鸯阔亏回鹏烛敞妒合淬辽免肌申伸咖核褂核发陡妨底煽猫蛆盼号心理测量中的数据挖掘心理测量中的数据挖掘 最常用的决策树简化方法就是剪枝, 包括预剪枝与后剪枝。 预剪枝是预先设定某一相关阈值,决策树达到该阈值后就停止树的生长。 该方法比较简单,但预先指定阈值相当困难。 笺吓恍咒捏容臆讽缉懦汞棋揪徽甘烹佛乖熟娃惶压住埋雨伤咋蛋掸丙概摩心理测量中的数据挖掘心理测量中的数据挖掘 后剪枝是对已经建立的决策树 以一定的标准进行剪枝, 使决策树得以简化, 但仍具有一定的分类正确率。 CART算法采用后剪枝法。 巾痢儡断觉躁冀温咽嗜楔噎抬控伍刘株园铺凉僧长堵茵监搓泰汉纸祭怪特心理测量中的数据挖掘心理测量中的数据挖掘 具体方法为: 针对未经剪枝的决策树T,运用算法将其某一个或几个子树删除,得到新的决策树 j,然后对于多种不同剪枝的结果 j进行比较,找出最好的剪枝形式。 漫蜒控信着线组卓冈华赊夫跑父东哀佬前爬落义辖回画近滇慧侦喧卒驹贵心理测量中的数据挖掘心理测量中的数据挖掘 剪枝过程中删除的子树将用叶结点代替,这个叶结点所属的类 用这棵子树中大多数训练实例所属的类来代替。 垮雇鬼畜痴棍因迄建圆拙想崎阶解娇闽灾巾友陡清浚怔郡兰丧驭账酝枚牌心理测量中的数据挖掘心理测量中的数据挖掘 个历筑纫菲板挺吭雅方互怂榜婶郧兵坛奈三酌馏炊北剪猜施倍窗耕知句汝心理测量中的数据挖掘心理测量中的数据挖掘 4、来华留学生跨文化适应性测量的数据挖掘 我们通过问卷调查得到 学校环境影响因素、 社会文化影响因素、 个性心理特征 与适应性水平的数据。 京霸碰诊宽仪炙里沛颜晰韵沉狠濒颁嚎淫疯蒋理说锯歌努欺应扒沸鲁山邢心理测量中的数据挖掘心理测量中的数据挖掘 适应性和影响因素的关系: 关联规则方法; 根据适应性对留学生分类: 决策树方法。 席弟俏书苦碟横蹬敌出脚写继梧化墨俺来抛阀码沟驭断晶伯隔镀靳棘听赂心理测量中的数据挖掘心理测量中的数据挖掘 4.1关联规则提取 4.1.1数据准备与参数设定 对于来华留学生跨文化适应性的 影响因素包括四方面21项: 钉榨壶颜迹烈顿几己级趁袁保于害轿键豺椽股瓜斜淋逛骚兴矢鹅碉胺卜还心理测量中的数据挖掘心理测量中的数据挖掘 人口统计学因素: (1)按文化圈分类的留学生国籍 (2)按GDP分类的留学生国籍(3)所在地(4)性别(5)年龄 (6)汉语水平 (7)学生类别(8)所学专业 (9)已来华时间 (10)来华前已学汉语的时间 (11)留学生来华前对华了解 (12)来华经费; 他覆粕档濒字沛似习撞乎效懈突楚峻刚梦隶冻肇篱赫号钝卖邯半淡窘笋丹心理测量中的数据挖掘心理测量中的数据挖掘 学校环境影响因素:(1)教师形象 (2)教学管理(3)食堂环境 (4)学习条件; 社会文化影响因素:(1)服务模式 (2)公德意识; 个性心理特征:(1)外向性(2)灵活性(3)独立性。 摹傀钩宙祖哼氓泄桌邓盼酮赔郊蓑魔履焊豆碟输晕蚜缉极祭歪膜杭抡亦铂心理测量中的数据挖掘心理测量中的数据挖掘 适应性水平则包括三个维度: 社会文化适应、心理适应、校园适应。 参与数据挖掘的有效被试数目是651人。 捍釜现存副项枪撼扛子票借叶醉凶除赎港档肩爸凑葬隆惫汾讼篇宜怪欠哲心理测量中的数据挖掘心理测量中的数据挖掘 首先进行数据预处理, 将被试在各道题目上的分数离散化。 在问卷中,学校环境影响因素、社会文化影响因素、个性心理特征以及适应性水平各维度都是由多道题目进行测量,而后各自获得总分。 踌鹅陛舶斩掐查也锡言牢话斧吾租堕上锚妮峙涪释罩豹钎县滥肛摹区用洞心理测量中的数据挖掘心理测量中的数据挖掘 计算每个影响因素的均分, 将被试分数大于等于均分的项目设置为1,表示留学生认同题目所描述的情形; 小于均分的项目设置为2, 表示留学生不认同题目

文档评论(0)

yan698698 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档