PSC机测和人工测试对比分析.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PSC机测和人工测试对比分析

PSC机测和人工测试对比分析   摘 要:本文统计了570名学生的机测成绩和人工测试成绩,以人工测试成绩为标准,充分对比了机器测试与人工测试成绩之间的差距,并对这种差距进行了深入的分析,得出了造成此种差距的原因。   关键词:PSC 机测 人工测试 对比分析      一、PSC测试简介   一直以来,普通话水平测试(PSC)都是由测试员进行人工测试。随着科技的发展,尤其是计算机技术的进步,由机器来自动完成普通话的测试已经进入了实用阶段。我们在这里介绍的机测普通话是利用中文信息处理、语音识别等技术让计算机对应试者普通话的水平进行打分评级,这个过程中基本上不需要人工的参与。   二、相关数据和统计方法说明   本文的数据包括了两个部分,一部分来自机器测试,另一部分是来自于人工测试,都是针对同一应试人的普通话成绩。目前机测只能完成被测内容的前三题,所以本文按照前三题分数、第四题分数和总分,按姓名排序,汇入一张表格。这样,每一个人的成绩形成一条记录,记录的项目包括姓名、机测前三、人测前三、前三误差、机测第四、人测第四、第四误差、机测总分、人测总分、总分误差、机测等级、人测等级共十二项。其中,“机测”是指机器测试,“人测”是指人工测试,“前三”是指前三题总分,“第四”是指第四题分数,误差=人测成绩-机测成绩。   表1:误差标准:   误差项目 前三题 第四题 总分   一级 1.6 0.5 2.1   二级 2.8 1 3.8   三级 4.2 1.5 5.7      注:前三题误差=第一题误差+第二题误差+第三题误差;总分误差=前三题误差+第四题误差。   等级误差则严格按照“机测等级=人测等级”,若两者不匹配就视为在等级上不相符,在本文中还会有级相符而等不相符者,标准是“机测级=人测级”。   三、总体情况分析   (一)总体数据及说明   表2:机测等级相符情况统计表    机测相符个数 机测个数 机测相符度   一级 0 0 0%   二级甲等 33 50 66.0%   二级乙等 106 284 37.3%   三级甲等 8 193 4.1%   三级乙等 0 41 0%   总体 147 570 27.8%      注:机测中,有2个是不入级的。机测相符度=机测相符的个数/机测个数。   表3:总分误差情况统计表    个数 所占比例   总分误差=0 529 93%   总分误差0 41 7%      注:总分误差=人测总分-机测总分   总体上机器测试的相符度并不高,但在各等级中又不尽相同。二级甲等的相符度能达到66%,而一级和三级一等的相符度为0。普通话水平测试等级为二级甲等的属于普通话较好的,所以,我们可以说,对于普通话较好的机器测试比较准确,而对于处在普通话水平两端的,机器测试与人工测试的相符度较低。而总分误差=0的数据占了总体数据的97%就说明了人测分数普遍高于机测分数。   机测的相符度为27.8%,可以说这个相符度是相当低的,说明机测还存在一些问题,机测的正确率还有待提高。但是,在各等级中,二级的相符度比一级、三级的要高,尤其是二级甲等,相符度为66%。由此,我们可以得出结论:对于普通话水平较高的,机测比较准确;而对于普通话水平较低的,机测不准确;这也就说明普通话水平的高低对机测普通话准确率有很大的影响。   (二)前三题数据分析   前三题完全是靠机器测出,我们说机测,在很大程度上就是指的这种机器自动测试普通话的情况。所以对于前三题机测误差的原因分析更能帮助我们寻找提高机测相符度的切入点。   表4:前三题机测等级相符且在误差范围内的数据分析    机测等级完全相符且前三题分数在误差范围内的个数      机测个数 机测等级完全相符且前三题分数在误差范围内的相符度   一级 0 0 0   二级甲等 25 50 50%   二级乙等 58 284 20.4%   三级甲等 3 193 1.6%   三级乙等 0 41 0      注:机测中,有2个是不入级的。   我们看到前三题的相符度分布情况和上文的分布情况有相同之处:都是二级甲等的相符度最高。但是我们也看到,当把误差范围引入之后,机测相符个数明显地减少了,说明了很多数据虽然等级相符,但前三题还是超出了最大误差范围。这就进一步降低了原本就不高的机测准确率。   机器测试普通话,对于普通话水平较高、音质较好的人来说,测试往往比较准确,而对于普通话水平较差的人来说,机器测试则往往存在较大的误差,尤其是普通话水平处在由二甲到二乙这个区间上时,机器测试的相符度是最低的,误差是最大的。   (三)第四题数据分析   第四题与前三题相比有自己的个性,

文档评论(0)

317960162 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档