- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《生物信息处理》期末重点整理(根据王泽宇手稿整理)
2013级智能系 高飙
双目视觉:由于人眼位置不同,导致两眼视网膜上重叠区域的图像有些不同,物体在两个视网膜图像上的侧向位移的相对距离称为视差。视差的大小跟物体到注视点的远近有关,因此可以感知深度。
深度的信息源:视觉/光学,双目/单目,稳定/运动,绝对/相对,数量/质量
单眼视觉线索:遮挡、线条透视、空气透视、明暗和阴影,运动级差,结构级差。
双眼视觉线索:水晶体的调节和双眼视轴的耦合;
双眼视觉线索的双眼视差是深度知觉的主要线索
深度线索的三种组织方式:Dominace, Compromise, Interaction
人耳包括外耳、中耳和内耳三个部分。外耳的耳廓将声音信号聚拢进来,通过外耳道引起鼓膜振动,鼓膜的振动可以通过中耳的听骨链传到内耳的卵窗、圆窗,引起内耳中淋巴的振动,之后通过耳蜗及其基底膜不同位置的响应形成神经信号传入大脑,产生听觉。
基底膜上不同位置有着不同的最大共振频率。蜗底基底膜窄、薄,响应高频信号;而蜗顶基底膜宽厚,响应低频信号。
声源定位:
Jeffross巧合检测模型,ITD最一致的时候判定声音的位置(锁相)
Rayleigh纯声双理论:低频(1.5kHz)用ITD锁相,高频用ILD(头=低通滤波)
Lindemann处理器:增加了一个延时,对其他延时侧抑制
降低了回声加混响效果
不允许频率依赖声音强度的差异
为什么语音识别很难?
语音的分割(分解),根据元音和辅音来确定每个单词的结构;
缺少不变性:发音移动,协同发音,快速语音,男女声道大小,方言,说话人的变化
对比音乐,语音更偏旗语,这是因为:
音乐是用离散的目标表达离散的听觉事件
旗语的目标也是离散的,而且目标之间存在转换过渡
语音在不同目标间存在发音的转换过渡
对比旗语,语音更偏语音,这是因为:
语音并没有不变的听觉目标,辅音会随着元音的变化而改变发音的方式,这要归因于协同发音。协同发音的提出是因为辅音的基本音调不能囊括所有的发音情况。
马尔框架用于理解复杂信息处理系统,分为三个层次:
计算理论:计算的目标,目标的合适性,一般策略
表达/算法:表达输入和输出,从一种表达到另一种表达转化的算法
实现:在物理层面,基于架构和硬件实现表达和算法
两个很模糊的图。前景识别分为消防栓和汽车,说明上下文信息对知觉处理的作用。
惠更斯1693年在法国一座城堡喷泉噪声中听到了一个特定的音调,这是由于石阶反射喷泉的声音,不同台阶反射的声音具有相继变长的时间间隔,最终感知到重复的基音。
双耳优先效应(哈斯效应)是一种双耳心理声学效应,声音延迟对方向听觉的影响比音量大小显著的多。两个声音以一定延迟发出,若延迟小于30ms,则听者只能听到第一个声音,若延迟大于30ms,则听者能听到两个分开的声音,但仍以第一声音为主确定声源的地点和方向。在语言识别中的作用?
抑制(好处); 捕捉:散度回声草坪,没有融合?坏处
sin
知觉组织的两个理论
结构主义:知觉是由每一点颜色感觉构成的感觉原子简单的组成;
每一个原子被视网膜上的一个特定位置定义,并且与其他原子相互独立
原子通过联想学习的过程构成了更大的空间复合体
格式塔:知觉组织是视觉神经系统全局的交互,并来自于视觉刺激的整体结构。
整体大于部分之和
Stroop效应:整体优先的三个推测
整体优势:对整体字母的反应应该比构成他的局部字体要快
整体-局部推理:不一致的整体字母应该会使主体观察局部特征时反应变慢,因为局部这层只有在整体被感知之后才能被感知到
无局部-整体推理:不一致的局部字母不应该使主体观察整体特征时反应变慢,因为整体是被优先感知的。
知觉是一个建构的行为,解释的过程。例如:将投射在眼中的复杂运动的2D光信号的模式转化为三维空间中对于3D物体的稳定感知
知觉是对周围环境的建模,观察者对环境建立可能的模型,在该模型中,环境会产生观察者会接受和感知到的视觉刺激模式。感知模型和外部环境投影图像中蕴含的信息紧密联系,并能对这些信息提供适当精确的解释
知觉是对意思的理解,观察者不仅能得到特定的形状和空间位置,还能够对物体分类,将其归为已知的类属使我们能够对它们做出合适的反应
逆问题:如何从场景的视觉图像逆向得知导致如此图像的物体的具体情况?
环境(良定义的)和其投影图像(不精确的)在数学关系上并不对称。感知是一个启发式的过程,我们对最可能产生接收到图像和声音的环境做出推断。
视知觉的四个阶段:Image-based, surface-based, object-based, category-based stages
颜色视觉的理论:
三基色理论:人眼中有三种颜色感受器(红绿蓝),三种颜色感受器的反应不同,是到达其上的光子
您可能关注的文档
最近下载
- 人教版九年级数学上册全套课件-(2).ppt VIP
- Q_SY 10016-2023 数据湖管理规范.pdf VIP
- 第5课 动荡变化中的春秋时期【课件】(共27张PPT)(含音频+视频).pptx VIP
- 05G525 吊车轨道联结及车挡(适用于钢吊车梁).pdf
- GNSS测量 GNSS测量 RTK线路放样1.ppt VIP
- 医院信息数据管理制度.docx VIP
- 2025年申论答题卡(练习标准)打印版 .pdf VIP
- 初二作文范文.docx VIP
- 《课外古诗词诵读》之《 赠从弟》-八年级语文上册同步教学精选课件(统编版).pptx VIP
- GNSS定位测量 RTK放样 实验实习实训-GPS-RTK点放样.doc VIP
文档评论(0)