- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十讲 句法模式识别
基本概念
1、结构模式识别:
有一些模式识别任务,不能在特征空间中用统计模式识别的方法得到解决。
汉字的识别:汉字有偏旁部首、笔划构成
字符的识别:字符的字体不影响识别
语言的识别:语言由音节、字、词构成
图像识别:画面分割,目标识别
生物识别:基因序列,染色体结构,心电图分类
定义:
以结构基元为基础,利用模式的结构信息完成分类的过程,称为“结构模式识别”。
其中“基元”指构成模式结构信息的基本单元,本身不包含有意义的结构信息。
基元的选取与应用有关:
文字:笔划或偏旁部首作为基元
语音:音素作为基元
心电图:收缩波和扩张波作为基元
图形:边缘线段、角点都可作为基元
讨论:
结构模式识别是与统计模式识别完全不同的一大类模式识别问题,一个基于结构信息,一个基于特征值
结构模式识别不仅能完成分类,还可以得到每个模式的结构性质
结构模式识别的依据是模式间结构上的“相似性”,这种相似度的度量不能用一般特征空间中的距离来表示
结构模式识别可以采用句法方法、拓扑分析方法、图论方法等多种方法
基元提取和分类器训练上的困难使得结构模式识别方法仍未成熟
结构模式识别系统的模式信息通常来源于图像、音频等多媒体信息源
2、句法模式识别
(1)句法模式识别的定义:
句法模式识别是利用模式的结构信息,以形式语言理论为基础来进行结构模式识别的方法。
傅京荪(1930-1985)
美国工程院院士、Purdue大学讲座教授、台湾中央研究院院士,国际模式识别协会(International Association for Pattern Recognition:IAPR)60年代提出句法模式识别。
(2)句法和文法:
句法
句法来源于语言学,是指由字(词)构成句子的方式,也就是一个句子组成的规则。
句法具有递归性,可以重复组合使用,用简单的规则可以表达复杂的结构。
可以用句法来表达结构模式识别中基元间的结构关系。
文法
文法是指一类相似的句子的共同句法规则。
可以用文法来表示一类样本的共同特点。
对某个具体的句子进行句法分析,判别与某类的文法是否相似,可以实现模式识别。
(3)形式语言:
形式语言是自然语言的抽象,是用一组明确的数学规则描述的语言,是语言的“数学化”,它由按一定规律构成的句子或符号串的有限或无限的集合乔姆斯基(Noam Chomsky, 1928--)语言学家,語言学与哲学系荣誉退休教授,曾任该,并任该校认知科学研究中心主任1957年出版《句法结构》学者,并是有史以来被引用数第八多的学者。
3、句法模式识别系统的组成
句法分析:
判断一个样本是否符合一定的文法,从而得到该样本与已知类别的相似性。
文法推断:
从分好类的训练集中获得该类所有样本的共同特征,形成代表每个类别的文法规则。
利用形式语言理论完善和坚实的数学基础,可用句法分析的方法来实现结构模式识别问题的求解
形式语言理论
基本概念:
(1)字母表:
与所研究的问题有关的符号集合。
例:V1={A,B,C,D}, V2={a,b,c,d},V3={0,2,6,8}
(2)句子(链):
由字母表中的符号所组成的有限长度的符号串。
例如有字母表{0,1},则{0,1,00,01,0110}就是有效句子的集合。
不包括任何符号的句子称为空句,记为λ。
V*:由字母表V中的符号组成的所有句子的集合,包括空句子λ在内。
例: V*={λ,01, 001}
V+:不包括空句子在内的句子集合,即V+=V*-(λ)
(3)句子(链)的长度:
句子所包含的符号数目,例: |a3b3c3|=9
(4)语言:
由字母表中的符号组成的句子集合,用L表示。
例:字母表V={a,b}
L1={ab,aab,abab} 有限语言
L2={anbm|n,m=0,1,2….}无限语言
在一种语言中,构成任何句子都必须遵循统一的规则,这些规则的集合称为文法,用G表示。L(G)表示由文法G构成的语言。
(5)文法
文法的数学定义:它是一个四元式,由四个参数构成:
G={VN, VT, P, S}
VT:终止符,不能再分割的最简基元的集合,用小写字母表示。 VT={a,b,c}
VN:非终止符,由基元组成的子模式和句子的集合。用大写字母表示。VN={A,B,C}
VT, VN的关系: VT∩VN= Φ(空集)
VT∪ VN= V(全部字母表)
S:起始符:属于VN非终止符中的一个符号
P:产生式(再写规则),存在于终止符和非终止符间的关系式。
例: α→β, α∈
您可能关注的文档
- 开网店的基础知识.doc
- 异常处理后不容再易次异常并正确解绑手机号出来用.doc
- 弓秀云我国人力资源管理专业发展现状调查与思考.doc
- 引入库文件vs0210环境设置.docx
- 引用不同表格数据公式怎样编辑及其跨工作薄复制粘贴.doc
- 弘扬周文化构建及谐岐山.doc
- 弗吉亚客户标准件规则.doc
- 弘扬核心价值观-汇聚社会正能量.doc
- 弘扬科学道德规则学术评价.doc
- 弘扬雷锋精神的策划书.doc
- 2025年智能快递驿站行业政策与市场机遇报告.docx
- 2025年校园安全防范中新能源电动巡逻车采购可行性分析.docx
- 2025年智能垃圾分类智慧监管平台在智慧旅游区的应用前景研究.docx
- 2025年智能家居报告:人工智能伦理风险的法律责任与用户隐私保护.docx
- 2025年智能垃圾分类与垃圾分类信息化管理结合的可行性研究.docx
- 2025年智慧社区远程医疗诊断中心在基层医疗机构运营管理中的应用报告.docx
- 2025年智慧社区:老年活动广场智能化升级研究.docx
- 2025年智能社区新能源电动巡逻车市场应用前景分析报告.docx
- 2025年智能垃圾分类智慧监管平台在垃圾分类回收与处理中的智能化改造路径.docx
- 2025年本土半导体材料产业链国产化战略布局报告.docx
文档评论(0)