- 1、本文档共26页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
【2018年最新整理】数据缺失及其填补方法综述
一 引言 三 数据缺失的处理方法 四 处理方法的选择与评价 二 数据缺失简介 五 总结 这段时间,阅读了相关的文献资料,对数据缺失的概念、缺失原因、缺失机制、缺失模式以及一些基本填补方法有了大致的理解,并初步了解了数据缺失处理方法的研究现状。 对于数据缺失国内外学者已经做了广泛的研究,但没有哪一种处理缺失数据的方法是普遍适用的,每种方法都存在不如人意之处 。目前各种新兴的方法层出不穷, 如人工神经网络, 机器智能模型等。所以针对各种实际问题, 要注意分清问题的实质, 适当地运用处理方法才是解决好实际问题的关键所在,此外,融合相关领域、相关学科的优秀算法,实现创新。 计划: 继续研读针对缺失数据构造分类器的相关文献资料,摸索其中的研究理论和方法,并结合相关学科的先进理论(核主元分析,遗传算法等),探究一种更高效的处理缺失数据分类问题的方法,与已有方法加以比较验证。 LOGO * LOGO * LOGO * 目录页 CONTENTS PAGE LOGO * TRANSITION PAGE 过渡页 LOGO * 引言 Part 1 LOGO * 数据缺失简介 Part 2 LOGO * Part 3 数据缺失的处理方法 LOGO * Part 4 处理方法的选择与评价 LOGO * 总结 Part 5 数据缺失及其填补方法综述 报告人:邵宏赡 日 期:2013.4 一 二 三 引言 数据缺失简介 数据缺失的处理方法 主要内容 四 处理方法评价 五 总结 一 二 三 引言 数据缺失简介 数据缺失的处理方法 四 处理方法的选择与评价 五 总结 在社会调查资料中,最为常见的问题就是 。造成数据缺失的原因有:失访、无响应或是回答问题不合格等等。统计学上,将含有缺失数据的记录称为不完全观测。缺失数据或不完全观测对调查研究的影响是很大的。所以在统计学中,为了能够更加充分地利用已经搜集到的数据,国内外很多学者都对缺失数据的处理提出了自己独到的见解,来挽救有缺失的调查数据,以保证研究工作顺利进行。 数据缺失 一 二 三 引言 数据缺失简介 数据缺失的处理方法 四 处理方法的选择与评价 五 总结 ——数据缺失是指在数据采集时由于某种原因应该得到而没有得到的数据。它指的是现有数据集中某个或某些属性的值是不完全的。 统计调查中能否按设计要求获得被调查单位的详全资料是衡量数据质量的一个重要标准, 但实际调查中经常遇到数据缺失的情况。 无回答有2种表现形式: 单位无回答(unit non-response)和项目无回答(item non-response) 。 “单位无回答”——被调查者不愿意或者不能够回答整张的问卷; “项目无回答”——被调查者拒绝回答个别的调查项目。 概念(Concept) 缺失原因(Reason) 在存储数据的过程中,由于机器的损坏造成数据存储失败; 调查员在采集数据过程中,由于主观因素人为地认为数据不重要或无用,而私自丢弃数据; 调查员信息录入失误; 受访者拒绝透露被调查信息,或回答错误信息; 受访者选取失误。例如调查工资情况,选取的受访者是婴幼儿。 在统计调查过程中,数据缺失是不可避免的,造成这种现象的原因是多方面的 ,主要有以下几种: Little和Rubin针对缺失数据,探讨缺失数据与目标变量是否有关,定义了3种不同的缺失机制。 产生机制( Mechanism ) MCAR MAR MNAR 完全随机缺失(Missing Completely At Random) :数据的缺失与不完全变量以及完全变量都是无关的。 随机缺失(Missing At Random):数据的缺失仅仅依赖于完全变量。 非随机缺失(Not Missing At Random):不完全变量中数据的缺失,依赖于不完全变量本身。这种缺失是不可忽略的。 产生机制( Mechanism ) 缺失模式( Pattern) 数据缺失模式主要研究哪些变量缺失,更确切的说,关注的是缺失数据矩阵R的分布。当一维目标变量出现缺失数据时,我们在数据处理过程中首先要考虑缺失数据产生机制,而对于多维目标变量而言,除了考虑缺失数据产生机制外,还要判断数据的缺失模式。 缺失模式( Pattern) 假设完全数据资料阵 y 是由m个观测、 n个变量组成的m×n矩阵,通过分析这个矩阵的特点,可以推断出数据缺失模式。 一 引言 四 处理方法的
您可能关注的文档
- 【2018年最新整理】户外无线IP预警广播系统.doc
- 【2018年最新整理】房地产企业发展战略之城市深度进入.ppt
- 【2018年最新整理】房地产企业品牌建设.ppt
- 【2018年最新整理】房地产企业政策常见问题汇总.ppt
- 【2018年最新整理】房地产企业营运资金管理论文.doc
- 【2018年最新整理】房地产会计总论.ppt
- 【2018年最新整理】房地产住宅项目策划.doc
- 【2018年最新整理】房地产估价实习报告外贸服饰店.doc
- 【2018年最新整理】房地产全程策划操作技巧与标准及典型案例评析实用手册.doc
- 【2018年最新整理】房地产公司人力资源管理问题与对策研究开题报告.doc
- 第18讲 第17课 西晋的短暂统一和北方各族的内迁.docx
- 第15讲 第14课 沟通中外文明的“丝绸之路”.docx
- 第13课时 中东 欧洲西部.doc
- 第17讲 第16 课三国鼎立.docx
- 第17讲 第16课 三国鼎立 带解析.docx
- 2024_2025年新教材高中历史课时检测9近代西方的法律与教化含解析新人教版选择性必修1.doc
- 2024_2025学年高二数学下学期期末备考试卷文含解析.docx
- 山西版2024高考政治一轮复习第二单元生产劳动与经营第5课时企业与劳动者教案.docx
- 第16讲 第15课 两汉的科技和文化 带解析.docx
- 第13课 宋元时期的科技与中外交通.docx
最近下载
- 单向板肋梁楼盖计算.docx
- 作业4:工学一体化课程《小型网络安装与调试》工学一体化课程考核方案.docx VIP
- 中国画之写意画.ppt VIP
- (2019苏教)小学科学三年级上册:全册整套教案资料.pdf
- 核心素养导向的高中数学课例设计研究与实践(样例)(1).doc
- 驾驶证延期委托书模板.doc
- 作业5:工学一体化课程《小型网络安装与调试》工学一体化课程终结性考核试题.docx VIP
- 作业5:工学一体化课程《小型网络安装与调试》工学一体化课程终结性考核试题.pdf VIP
- 中国画的构图形式ppt课件.pptx
- 作业11:《小型网络安装与调试》工学一体化课程教学进度计划表.pdf VIP
文档评论(0)