11论文工作总结和展望.doc

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第八章 论文工作总结与展望 在本文绪论中曾提到,视觉心理学在计算机视觉中的应用还存在着一些理论问题急需解决,故本章先对这些问题进行讨论。这是作者本人对博士期间研究工作所作的一次总结与反思。虽然这些想法还很不成熟,有些结论还存在争议,但还是毫无保留地把所思所想写了下来,目的在于给他人以启迪、以借鉴,并希望其它学者在对我的想法进行摒弃的同时,更快更好地前行。 接着,本章对整篇论文进行全面总结,提出进一步的研究构想,并对论文的应用前景进行展望。 对理论问题的讨论 前面各章主要阐述如何运用视觉心理学的有关理论来解决具体的计算机视觉问题,关注重点主要是细节性、局部性的问题,而对整体性的理论问题研究不足。把视觉心理学应用到计算机视觉中,急需解决的理论问题有:对接的层次问题、计算机视觉问题的适用性、心理学结论的适用性、心理学结论的取舍问题、定量化描述定性问题与跨学科的交流问题。下面分别对这些问题谈谈个人一些粗浅的看法。 (1) 对接的层次问题 各门科学都需要不同层次水平的解释。客观世界太复杂,为了控制复杂性,不得不对客观世界进行抽象,故形成了不同的层次。 计算机视觉的奠基人Marr把视觉问题看作信息处理过程,提出应从三个不同层次(计算理论层、表象与算法层、硬件实现层)进行分析与理解。Marr以商场现金收款机为例来描述这一理论。他认为计算理论要解决的问题是明确我们要对什么东西进行计算,以及为什么要对它们进行计算,关键还在于后者。每个人都知道,现金收款机执行的是加法运算,它执行的为什么是加法运算,而不是别的运算(如乘法)呢?这是因为对商品单价的组合规则(付款规则)正好符合数学上的加法理论。 把商品分成几组,每组一起付款,与每件商品单独付款,所付的总额是一样的,故结合律成立。 不买东西,不用付钱,故存在零元。 买了东西,然后退货,则总的付款为零,故存在负元。 对商品付款的顺序不影响付款的总额,故交换律成立。 上述四条规则正好定义了一个加法群,故现金收款机应执行加法运算,而不是别的运算。 第二层次所说明的是怎样做,主要解决问题的表象与算法。对于加法运算,可以选用阿拉伯数字(十进制)作为表象,而算法则可以沿用通常的加法规则,即先从低位加起,和大于9就进位。人与收款机一般使用这种表象。当然也可以使用二进制表象,从高位加起。早期的计算机使用的就是这种表象。故计算理论可以用不同的表象与算法来实现。 第三个层次是解决如何运用物理手段来实现上述表象与算法。这时也有多种选择。如对于加法运算,儿童可用扳手指的方法,小学生可用笔算,而大学生则用电子计算机来算。硬件不同,但功能是基本相同的。 在计算机视觉问题的三个层次中,计算理论是最重要的,通过理解正待解决问题的本质,算法可能比较容易理解,而考察用以解决问题的机制(硬件),对理解算法则往往没有很大的帮助。例如,为了理解鸟为什么会飞,必须懂得空气动力学。然后对羽毛的结构和各种不同的鸟翼形状的理解才有意义。计算理论层的基本任务是发现并分离出假定(又称约束),它既足以定义一个处理过程,又具有很强的物理合理性。 心理学家也在三个不同的层次(分析的心理层次、分析的认知层次、分析的神经层次)上进行研究[Best 2000],不同层次的解释是对同一事物不同级别的抽象。 当被问及在童年时代所住房子窗户的数目时,大多数人会产生类似于心理照片的心理意象,并会对它进行描述,以数出窗户的数目。这种意象及其性质位于分析的心理层次。在这种层次上可以审慎地从事一些心理内容的操作,如扫描窗户数目、窗户的颜色、房子距离街道的远近等等。心理的分析层次是伴随着意识体验的心理现象。 但是头脑中并没有照片。有意识的心理意象都是神经活动的独特类型,或独特模式、独特位置的体验。只是在正常的情况下,我们无法有意识的体验到神经活动。神经层次是具体的或物质的层次。 分析的认知层次是介于分析的心理层次与分析的神经层次之间的层次,它是对发生在神经层次上的事件的抽象说明,是以判定、参与、贮存、提取等与神经活动没有联系的术语来研究心理过程。例如,构造前面房子的心理表象包括两个过程:首先,必须找到这间房子所有的贮存表象,然后决定将要被描绘的意象的特征(如房子旁边的树上有叶子吗?地上有雪吗?);其次构建一个人们能意识到的意象。也就是说,当我们谈到人的某个部位“搜索”意象、“判定”意象有何特征并构建意象时,我们在描述这些活动时,使用的既非神经方面的术语也非心理方面的术语(因为没有意识到任何事情),而是使用另一种抽象的语言,它与任何类型的神经操作及对这些神经过程的描述均无联系,这就是分析的认知层次语言。 虽然理论上我们最终也许可以发现心理层次或认知层次事件的神经机制,但是若无高于神经机制的抽象解释,对许多心理现象的事实我们仍然无法解释[Rock 1984, pp1-12]。例如,

文档评论(0)

0520 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档