汉语语言模型研究与其在音字转换中应用.pptVIP

汉语语言模型研究与其在音字转换中应用.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
N元概率参数修正学习 实验结果 实验一:选取了20篇不同领域的完整的文章(不包含在训练语料中)分别进行测试。实验结果为:未采用机器学习时,音字转换准确率平均为90.5%,采用本文的机器学习时,准确率平均为94.9%。 实验二:通过在线拼音键盘输入实验,对机器学习前后的音字转换结果进行测试,经过短时记忆后,重新输入的准确率达到98%以上。 实验结果 实验三:针对上百万规模的混合类型文本进行测试。整体进行机器学习后,对学习前后的音字转换准确率进行对比。实验结果表明,准确率从91.3%提高到91.9%。这说明经过长期的机器学习过程,学习结果对最初输入的文本所起作用将减小或消失。 5 面向手机类设备的智能拼音汉字输入方法 面向信息设备的汉字输入面临的问题: 面向小键盘的汉字编码方案研究更困难 信息设备的各方面性能较低,对应用程序限制苛刻 智能拼音汉字输入解决方案 面向数字键盘的三拼输入法 适于小内存应用的拼音汉字智能转换系统 面向数字键盘的三拼输入法 逐级分类思想 面向数字键盘的三拼输入法 逐级分类思想 假设数字键盘中的12个字符键都可用来输入拼音,最后确定407个常用拼音,考虑通过3级分类来实现 分类规则应该尽量简单、直观、容易被用户接受 每级的分类数必须小于12 面向数字键盘的三拼输入法 数字键 拼音 首字母 单字符 韵母 多字符 韵母 i起始 韵母 u起始 韵母 拼音数 ? 2 ? A ? 5 ? ? 5 B 4 7 5 ? 16 C 4 8 ? 4 16 ? 3 D 4 8 6 4 22 E ? 4 ? ? 4 F 3 6 ? ? 9 ? 4 G 3 9 ? 7 19 H 3 9 ? 7 19 i(ch) 4 8 ? 6 18 ? 5 ? J 2 ? 9 3 14 K 3 8 ? 7 18 L 6 8 8 4 26 ? 6 M 5 8 6 ? 19 N 6 9 7 3 25 O ? 2 ? ? 2 ? 7 P 4 8 5 ? 17 Q 2 ? 9 3 14 R 3 7 ? 4 14 S 4 8 ? 4 16 ? 8 T 4 8 4 4 20 u(sh) 4 8 ? 7 19 v(zh) 4 9 ? 7 20 ? 9 W 3 6 ? ? 9 x 2 ? 9 3 14 y 5 5 2 3 15 z 4 9 ? 4 17 合计拼音数 407 面向数字键盘的三拼输入法 分类方法 第一级分类:按照手机键盘定义对拼音的第一个字母(声母)进行分类,双声母ch、sh、zh分别用i、u、v表示,零声母用首字符表示,使用了8个数字键(2-9) 。 第二级分类:按首字母分类后的每一大类中,对每个首字母相同的拼音,再按照单字符韵母、多字符韵母以及带介母(i、u)的韵母分类,分别用?、*、和介母加*(i*、u*)表示,最多对应12个子类。 第三级分类:每一类对应一个特定的拼音,对应每一个二级子类,最多有9个小类即9个拼音。 面向数字键盘的三拼输入法 面向数字键盘的三拼输入法 输入方法 第一键:根据手机键盘布局输入一级分类号,即按对应的数字键,此时二级分类被提示出来; 第二键:根据提示从键盘输入对应二级分类的键,此时,最终的拼音被提示出来; 输入对应某拼音的键,则完整的拼音被确认,完成一个拼音的输入过程。 面向数字键盘的三拼输入法 例1:输入汉字“龙”,其拼音为“long” jkl ? l* ? 龙 ? ? abc def ? j? ji* ju* ? lai Lan lang ghi jkl mno k? k* ku* lao Lei leng pqrs tuv wxyz l? l* li* long Lou ? ? ? ? lu* ? ? ? ? ? 面向数字键盘的三拼输入法 例2:输入汉字“江”,对应拼音“jiang”。 jkl ? ji* ? 将 ? ? abc def ? j? ji* ju* ? jia jian jiang ghi jkl mno k? k* ku* jiao jie jin pqrs tuv wxyz l? l* li* jing jiong jiu ? ? ? lu* ? ? ?

文档评论(0)

smartxiaohuli + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档