- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
贵州彝文信息技术的研究概述
贵州彝文信息技术的研究概述
从上世纪80年代开始,我国少数民族语言文字信息化建设工作就启动了,经过30多年不断发展,取得一系列标志性成果。其中我国藏文、蒙文、维吾尔文、现代彝文等少数民族语言文字成绩斐然,先后完成了“文字编码字符集、字型、键盘等国家标准研制工作,并先后获得了国际ISO/IEC 10646标准,即每个民族文字字符在Unicode编码体系中的唯一性,实现与全世界多文种的统一编码、同平台显示。通过民族文字信息处理学科的基础研究工作的扎实推进,成功解决了民族文字信息技术的输入、输出难题。在现代移动通讯手机上也实现了民族文字的数字化传输与应用。近几年,藏文、现代彝文等在语料库建设、智能机器翻译、民族语言文字网站、大数据云平台等信息化产业方面获得很大的发展,与现代社会信息技术发展共同进步。
运用现代信息技术充分发掘民族语言文字资源,开发的各种民族语言文字信息化产品在民族地区社会生产、生活等各个领域得到了广泛应用。少数民族语言文字信息化建设,是民族地区信息化产业建设的重要组成部分,是基础性建设工作。早在2008年北京语言大学党委书记李宇明教授就指出,“民族语言文字是中华民族的宝贵财富,是非物质文化遗产的重要内容。对其进行规范化、标准化、信息化建设,成为当务之急,是信息时代提出的新任务”。
彝文是我国少数民族文字之一,开展彝文信息处理研究工作是现代信息社会发展的必然要求。开发彝文信息处理技术,实现彝文的数字化应用,才能更有效地发挥彝文传承民族文化的载体作用。
彝文信息处理技术是随着现代计算机信息技术的快速发展应运而生的一门新兴的应用技术,是指利用计算机技术对彝文字符的音、形、义等信息进行处理。即对字、词、句、篇章的输入、输出、识别、分析、理解、生成等的操作与加工技术,是实现彝文信息化的关键性技术。
贵州在彝文信息处理基础研究工作中,目前主要以开发贵州彝文计算机输入软件为突破口,开发具有自主知识产权的核心专利技术,同时积极研制相关规范标准,开创了贵州彝语文信息化产业大繁荣、大发展的新格局。
一、主要研究?M展及取得成果
(一)整理彝文字符,建立《信息技术 彝文编码字符集?q大字符集》
字符(Character)是各种文字和符号的总称,包括彝文字符、标点符号、图形符号、数字符号等。本文中“彝文字符集”(Yi Character Set)是指在贵州境内使用的彝文字、标点符号、图形符号、数字符号等彝文信息交换所需的多个字符集合。
彝文字符整理是彝文信息处理的基础研究工作。从2012年贵州开展贵州彝文字符整理工作,笔者通过负责贵州省2012年社科基金项目“贵州彝文编码字符集研制”,在毕节市彝文文献翻译研究中心主任王继超老师的支持下,以贵州《简明彝汉字典》、《彝文字释》为选字蓝本,以贵州经典传世彝文文献《彝族源流》、《宇宙人文论》等为选字范本,在常用字整理工作中,采用“源自古籍,保持风貌,字形美观,便于书写,符合用字规律”原则来开展工作。对于异体字整理按照“最大限度剔除异体字数量,选择使用频率高的字形,充分遵循彝文的构字规律,选择结构合理、笔画简易的字形”为选字原则。构建5000余字《信息技术 彝文编码字符集.基本集》,为贵州彝文信息处理学科发展奠定基础。
2014年根据贵州彝文古籍文献数字化整理翻译的用字需求,笔者与贵州工程应用技术学院(原毕节学院)的刘云老师合作,依据《滇川黔桂彝文字集?贵州卷》里彝文字符,同时参考贵州传世彝文文献。对彝文字符进行增补,对于同组异体字整理中尽量选择结构合理、笔画简洁的字形,放弃弯曲复杂疑难笔画,纠正有的使用者在日常使用中故意增加笔画,或手写错误字形,整理出4000余字,并对彝文字形进行矫正、规范,建立9000余字《信息技术 贵州彝文编码字符集?大字符集》,能满足彝文日常应用、彝语文教学、彝文文献整理、翻译等用字需求,达到彝文信息技术开发的用字需求。
(二)开发彝文印刷字体,建立彝文字库
彝文印刷字体是以《信息技术 彝文编码字符集.大字符集》为研究蓝本,采用True Type这种新型数字化字形描述技术,根据彝文字体设计“易读性、艺术性和思想性”的基本原理,按照“平、直、正、方、圆、匀”的要求设计彝文基础笔画。在此基础之上设计True Type彝文“正体”字形,建立彝文字库。
此外2014年在贵州省民委古籍办支持下,笔者与研究团队合作开发出“彝文楷书字体”。彝文楷书字体是以彝文经典古籍文献为基础,以彝文经典书法作品为依托,如“水西大渡河建石桥碑记”,同时参照学界前期研究成果,如《简明彝汉字典》,《贵州彝族语言文字》等学科著作,对彝文书写规律、笔画特征、字型结构、书写笔顺等研究成果,归纳彝文楷书字体的艺术特征及基本规律。按照“笔形
文档评论(0)