- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
材料设计原理
1.在模式识别、人工神经网络方法中,为什么要进行数据预处理?如何进行预数据处理?
答:进行数据预处理有四点原因:
1. 原数据可能数据量很大,维数很,计算机处理起来时间复杂度很高,预处理可以降低数据维度。
2. 数据的很多特性非常影响神经网络等分类模型的效果。比如数据值得分布不在一个尺度上,当地气温值与当地月工资显然不在一个数量级上,这时,需要数据规范化,把这两个特征的数据都规范到0到1,这样使得它们对模型的影响具有同样的尺度。
3.在基于统计方法的生物识别技术领域,所谓的预处理一般是指去除噪声的干扰,加强有效信息的过程。前面已经提到,原始数据的采集不可避免的要引入一些噪声的干扰,对于一个实际的生物识别系统而言,预处理是一个必要的环节。但是,需要注意的是,虽说预处理的作用都是减弱甚至消除噪声的干扰,同时增强有用信息的强度,不过,针对不同的特征,预处理的方法也是千差万别。
4. 数据预处理还有很多,比如中心化,去噪,降维,平滑,变换等等,各有各的目的,总之都是为了最终分类器的效果服务,由于原数据可能含有大量的噪声,去除噪声是有必要的。
由于BP神经网络的隐层一般采用Sigmoid转换函数,为提高训练速度和灵敏性以及有效避开Sigmoid函数的饱和区,一般要求输入数据的值在0-1之间。因此,要对输入数据进行预处理。一般要求对不同变量分别进行预处理,也可以对类似性质的变量进行统一的预处理。如果输出层节点也采用Sigmoid转换函数,输出变量也必须作相应的预处理,否则,输出变量也可以不做预处理。
预处理的方法有多种多样,各文献采用的公式也不尽相同。但必须注意的是,预处理的数据训练完成后,网络输出的结果要进行反变换才能得到实际值。再者,为保证建立的模型具有一定的外推能力,最好使数据预处理后的值在0.2-0.8之间。
在训练神经网络前一般需要对数据进行预处理,一种重要的预处理手段是归一化处理。下面简要介绍归一化处理的原理与方法。
(1) 什么是归一化? 数据归一化,就是将数据映射到[0,1]或[-1,1]区间或更小的区间,比如(0.1,0.9) 。
(2) 为什么要归一化处理? 1输入数据的单位不一样,有些数据的范围可能特别大,导致的结果是神经网络收敛慢、训练时间长。2数据范围大的输入在模式分类中的作用可能会偏大,而数据范围小的输入作用就可能会偏小。3由于神经网络输出层的激活函数的值域是有限制的,因此需要将网络训练的目标数据映射到激活函数的值域。例如神经网络的输出层若采用S形激活函数,由于S形函数的值域限制在(0,1),也就是说神经网络的输出只能限制在(0,1),所以训练数据的输出就要归一化到[0,1]区间。4S形激活函数在(0,1)区间以外区域很平缓,区分度太小。例如S形函数f(X)在参数a=1时,f(100)与f(5)只相差0.0067。
(3) 归一化算法 :一种简单而快速的归一化算法是线性转换算法。线性转换算法常见有两种形式:1 y = ( x - min )/( max - min ),其中min为x的最小值,max为x的最大值,输入向量为x,归一化后的输出向量为y 。上式将数据归一化到 [ 0 , 1 ]区间,当激活函数采用S形函数时(值域为(0,1))时这条式子适用。2:y = 2 * ( x - min ) / ( max - min ) - 1。这条公式将数据归一化到 [ -1 , 1 ] 区间。当激活函数采用双极S形函数(值域为(-1,1))时这条式子适用。
2.请详述蒙特卡罗方法中的基本思想、特点及其局限性?
答:就数学特性而言,蒙特卡罗方法的发展可以追溯到18世纪著名的蒲丰问题. 1777年,法国科学家蒲丰(Buffon)提出用投针试验计算圆周率π值的问题. 这里我们用蒲丰问题来初步说明蒙特卡罗方法的基本原理和解决问题的基本手续.
蒲丰问题是这样一个古典概率问题:在平面上有彼此相距为2a的平行线,向此平面任意投一长度为2l的针,假定la,显然,所投的针至多可与一条直线相交,那么,此针与任意条平行线相交的概率可以求出,由下面的分析可知,此概率与所取针长2l 、平行线间距2a有关,并且包含有π值. 在这里,任投一针的概率含义有以下三点:(1) 针的中点Ml在平行线之间等概率落入,即Ml 距平行线的距离x均匀分布在区间[0, a]之内;(2) 针与线的夹角θ均匀分布在区间[-π/2,π/2]之内,(3) x与θ互相独立。
MC方法的基本思想是:当所要求解的问题是某种事件出现的概率,或者是某个随机变量的期望值时,它们可以通过某种“试验”的方法,得到这种事件出现的频率,或者这个随机变数的平均值,
您可能关注的文档
- 材料科学基础试题库答案详解.doc
- 材料科学英语专业词汇详解.doc
- 本科毕业论文答辩,精美模板,个人原创详解.ppt
- 本科毕业论文答辩-木质素基酚醛树脂泡沫塑料的结构与性能研究详解.ppt
- 材料科学与工程基础实验讲义详解.doc
- 材料科学与人类文明-第2章详解.ppt
- 本科大课--器官移植病人的记理详解.ppt
- 材料力学(I)第九章详解.ppt
- 本科生论文写作规范详解.ppt
- 材料力学(I)第一章详解.ppt
- 小学语文成语大全形容痛苦的成语.doc
- 鸭2025版新高考地理一轮复习选修第48讲环境保护教学案湘教版.doc
- 2024高考生物二轮复习课时作业9生物的变异与进化含解析.doc
- 新高考2024高考生物一轮复习练习14孟德尔豌豆杂交实验一含解析新人教版.doc
- 鸭2025版新高考历史一轮复习第一单元古代中国的政治制度第3讲从汉至元政治制度的演变学案新人教版.doc
- 2024高考物理二轮复习高考题型一选择题专项练4含解析.docx
- 2025届高考英语一轮复习阅读理解分类练习专题05阅读理解之七选五学与练含解析.doc
- 鸭2025版新高考历史一轮复习第十单元世界各国经济体制的创新和调整第27讲空前严重的资本主义世界经济.doc
- 鸭2025版新高考历史一轮复习第十二单元西方人文精神与近现代科技与文化第39讲近代以来世界科技的发展.doc
- 高考语文最新精英时文精选素材十一.doc
文档评论(0)