- 1、本文档共47页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
多少数民族语言连续语音识别方法及应用
多少数民族语言连续语音识别方法及应用
正文:参照以下提纲撰写,要求内容翔实、清晰,层次分明,标
题突出。请勿删除或改动下述提纲标题及括号中的文字。
(一)立项依据与研究内容(5000-10000 字):
1.项目的立项依据 (研究意义、国内外研究现状及发展动态分
析,需结合科学研究发展趋势来论述科学意义;或结合国民经济和社
会发展中迫切需要解决的关键科技问题来论述其应用前景。附主要参
考文献目录);
1.1 研究方向和意义
中国是个多民族国家,每个民族都有自己独特的语言。研究多民族背景下的
多语言和跨语言现象,对促进语言互通互融、建设文化和谐、维护民族稳定具有
重要意义。本研究关注少数民族语音识别技术,特别是多语种少数民族语言的语
音识别技术,实现一个可适用于多少数民族语言的统一建模方法和识别系统,该
方法和系统既可以支持资源相对丰富的少数民族语言(如维吾尔语、蒙古语),
也可快速移植到资源稀缺的少数民族语言(如彝语、侗语)。同时,本项目还将
建设和开放一系列数据资源、测试标准、标注平台和处理工具,推动多少数民族
语言语音识别和相关领域 (如信息抽取、自然语言理解等)的研究进程。
多少数民族语言语音识别的研究有助于国家均衡发展和整体振兴。与沿海经
济发达地区相比,少数民族地区的经济发展相对落后,其中一个重要原因是语言
障碍阻碍了与发达地区的交流。语音识别是打破语言壁垒的第一步,基于语音识
别技术的少数民族语音输入法、语言翻译、多语言自动问答系统等将极大推动民
族间的互通互荣。同时,语音识别技术带来一系列产业机会也将直接促进少数民
族地区的经济发展,如少数民族语言呼叫中心建设、多语言口语语音评测等。
多少数民族语言语音识别的研究有助于提高社会服务质量,维护社会维定。
少数民族分布广泛而分散,社会管理困难。依靠信息技术可以极大提高政府社会
服务质量,其中语音识别技术作为打破语言障碍的关键一环具有重要意义。一方
面,语音识别技术可以提高交流效率,改进政府服务的反应速度,另一方面,基
于语言识别技术的关键信息提取技术可以对信息进行有效甄别和过滤,有利于保
证社会稳定。
多少数民族语言语音识别的研究有助于提升国家影响力。当前中国正加紧布
署一系列新文化交流战略,特别是新丝绸之路计划,途经众多小语种国家,打破
语言壁垒是保证该计划顺利实施的重要环节。多少数民族语言语音识别系统或者
可以直接应用到周边国家(如哈萨克斯坦),或者可以快速移植到相关国家的语
言,促进国际间的交流合作,提升国家影响力。
1.2 我国少数民族语言概述
我国是多民族国家,包括占人口绝大多数的汉族和 55 个少数民族。根据 2010
1
年第六次人口普查数据,人口在百万以上的少数民族有 18 个 。这 55 个少数民
族共使用约 72 种语言,这些语言分别属于五个语系:汉藏语系、阿尔泰语系、
南岛语系、南亚语系和印欧语系,其中汉藏语系和阿尔泰语系占绝大多数。
汉藏语系2
包括汉语和藏缅、壮侗、苗瑶等 3 个语族。汉语在语言系属分类中相当于一
个语族的地位,使用汉语的人口有 11.09 亿多;藏缅语族包括藏语、门巴语、珞
巴语、僜语、嘉戎语、羌语、普米语、独龙语、土家语、彝语、傈僳语、纳西语、
哈尼语、拉祜语、白语、基诺语、怒语、景颇语、阿昌语、载瓦语等,使用人口
约 2200 万;壮侗语族包括壮语、布依语、傣语、侗语、水语、仫佬语、毛南语、
拉珈语、黎语、仡佬语等语言,使用人口 2300 多万;苗瑶语族包括苗语、布努
语、勉 (瑶)语和畲语等语言,使用人口约 940 万。
汉藏语系语言一般有固定声调,很多语言的元音分长短,声母清浊音对立,
一部分语言保留有复辅音声母。汉藏语系各语言以词序和虚词为表达语法意义的
重要手段。词序比较固定。虚词种类较多,在句中表示各种不同的语法意义。汉
藏语系语言词类上的一个特点是有量词。量词的作用主要表示事物的 单位和动
作行为的量。此外,许多语言的量词还兼表事物的类别、形状、性别、级别等特
征。汉藏语系语言有词的重叠形式,在许多语言里具有共同的特点,重叠的范围、
作用、形式等方面。其次,各语言还有一批表示不同句式和语气的助词,一般都
用于句子末尾。
阿尔泰语系3
1 /view/1917.htm
2 /view/18703.htm
包括蒙古、突厥、满通
文档评论(0)