- 1、本文档共16页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于半监督式学习之广播节目语音逐字稿自动转写系统Automatic
The 2017 Conference on Computational Linguistics and Speech Processing
ROCLING 2017, pp. 197-212
飪 The Association for Computational Linguistics and Chinese Language Processing
鍩烘柤鍗婄洠鐫e紡瀛哥繏涔嬪唬鎾瘈鐩獮闊抽€愬瓧绋胯嚜鍕曡綁瀵郴绲
Automatic Transcription of Broadcast Radio Speech
Based on Quality Estimation-Guided Semi-Supervised
Training
鐜嬫槦鏈圫ing-Yue Wang,瑷卞惓鑿 Wu-Hua Hsu, 寤栧厓鐢 Yuan-Fu Liao
鍦嬬珛鑷哄寳绉戞妧澶у闆诲瓙宸ョ▼绯
Department of Electronic Engineering, National Taipei University of Technology
, asmayday24@, yfliao@.tw
鎽樿
寤f挱绡€鐩 瑁戒綔鏅傞€氬父鍙湁鏀堕寗瑾為煶瑷婅櫉 锛屾矑鏈変繚鐣欑浉灏嶆噳鐨勭瘈鐩収瀹硅┊閲嬭硣鏂
锛坢etadata 锛夛紝灏庤嚧绡€鐩挱鍑哄緦 锛屽緢闆f绱㈢瘈鐩収瀹 鎴栨槸锛 鍔犱互绲勭箶鍐嶅埄鐢ㄣ€傞嚌灏嶆鍟忛锛
甯哥敤鐨勬柟娉曟槸 浠ヨ獮闊宠鲸瑾嶅櫒锛岃嚜鍕曡綁瀵唬鎾瘈鐩収瀹癸紝鐢㈢敓瑾為煶閫愬瓧绋匡紝浣嗘槸鐩墠缂轰箯
宸叉瑷樺ソ鐨勫唬鎾獮闊宠獮鏂欏韩锛屽洜姝 鐒℃硶瑷撶反鍑洪仼鍚堣綁瀵唬鎾瘈鐩殑瑾為煶杈ㄨ瓨鍣ㄦ墍浠ャ€ 鍦
鏈珫鏂囦腑锛屾垜鍊 鎺㈣◣濡備綍鍚屾檪浣跨敤瑾為煶瑷婅櫉 鐗瑰镜鍙冩暩銆佽鲸瑾嶅櫒杈ㄨ獚 绲愭灉鑸囪獮瑷€妯″瀷 鍙冩暩锛
瑷撶反涓€瑾為煶鍝佽唱浼扮畻 (Quality Estimation 锛孮E鍣? 锛屽彇浠e偝绲卞彧渚濊炒瑾為煶杈ㄨ獚鍣ㄧ殑淇″績鍊
浼扮畻 锛圕onfidence Measure 锛夛紝寰炴簮婧愪笉绲 锛屼絾鏈瑷樼殑澶ч噺寤f挱瑾炴枡涓紝鎸戦伕閬╁悎瑷撶反
瑾為煶杈ㄨ獚鍣ㄧ殑瑾炴枡 锛岄€茶鍗婄洠鐫e紡鑱插妯″瀷瑷撶反锛屼互鎻愬崌杞夊寤f挱瑾炴枡閫愬瓧绋跨殑 鏁堣兘銆
瀵﹂涓 浠ヤ竴涓嶄匠閷勯煶鍝佽唱NER-set1 鑸囦竴鍎壇 NER-set2 涔嬪唬鎾瘈鐩脯瑭﹁獮鏂 闆嗭紝娓│绋
瀛愯獮闊宠鲸瑾嶅櫒 鑸囩稉鍗婄洠鐫e紡瑷撶反寰岋紝鏂扮殑瑾為煶 杈ㄨ獚鍣ㄨ綁瀵獮闊抽€愬瓧绋跨殑鏁堣兘 銆傚椹楃祼鏋
椤ず 缍撳崐鐩g潱寮忚〒绶村緦锛屾柊鐨勮獮闊 杈ㄨ獚鍣ㄥ彲浠ユ妸NER-set1 鑸嘚ER-set2鐨 瀛楀厓杈ㄨ獚閷
鐜囷紙CER 锛夊緸鍘熷绋瓙妯″瀷鐨 25%鑸?4.24% 锛屽浣 鑷?3.61%鑸?3.24% 銆傛澶栵紝鑻ラ€蹭竴
姝ユ敼鐢 閫查殠瑾炶█妯″瀷锛屾洿鍙皣 CER鍐嶆敼鍠 鑷?3.25%鑸?2.63% 銆
闂滈嵉瑭烇細 鍗婄洠鐫e紡瀛哥繏銆佸搧璩及绠椼€佷俊蹇冨害瑭曚及銆佽獮闊宠鲸瑾 绯荤当
197
1. 绨′粙
寤f挱绡€鐩殑瑾為煶璩囨枡婧愭簮涓嶇禃 锛屼絾鍥犱汉鍔涖€佽硣婧愮瓑鍥犵礌锛屽唬鎾瘈鐩=浣滃畬鎴愬緦锛岄€
甯稿彧鏈変繚鐣欐渶寰岃鎾嚭鐨勮獮闊宠▕铏燂紝娌掓湁灏囬寗瑁介亷绋嬩腑鐨勭敤鍒扮殑鐩搁棞璩囨枡锛屾暣鐞嗘垚寰岃ō
璩囨枡锛 metadata 锛夈€傚皫鑷寸瘈鐩挱鍑哄緦锛屽緢闆f鍐嶆 绱㈢瘈鐩収瀹癸紝鎴栨槸鍔犱互绲勭箶鍐嶅埄鐢ㄣ€傚洜
姝ゆ垜鍊戝笇鏈涜兘澶犺綁瀵唬鎾瘈鐩敘鐢熻獮闊抽€愬瓧绋匡紝 浠ヤ究灏囧唬鎾瘈鐩 绲勭箶鎴愭湁鑱叉浉 璁撻€欎簺锛
澶ч噺鐨勮獮闊宠硣鏂欏彲浠ユ湁鏇村鐨勫姞鍊奸亱鐢ㄣ€傞櫎浜嗗彲浠ヨ畵鑱界溇鑳藉瀹规槗鍦 浠ユ枃瀛楁绱㈢殑鏂瑰紡锛
鍘绘壘鍒版渶闂滈嵉鐨勮瑳杩板収瀹归儴鍒嗭紝灏ゅ叾鏄悕浜哄湪绡€鐩腑鎵€瑾殑鏁呬簨銆佹兂娉曟€濈董銆佹柊鐭ョ瓑绛 锛
涔
您可能关注的文档
- 华东师范大学2016年工商管理硕士MBA招生简章-MBA院校库.PDF
- 华中农业大学大学生创业孵化器管理办法.PDF
- 十二年国教--差异化教学.DOC
- 华南师范大学国际商学院本科人才培养改革行动计划为适应创新型.PDF
- 华能国际华能黑龙江发电有限公司2015年及截至2016年5月31日止.PDF
- 单元三服装运输包装系统设计.PPT
- 卓越中坚企业奖法蓝瓷的经验分享.PDF
- 单样本与总体比较的统计分析Stata实现.DOC
- 南京信息工程大学大学生创业园管理办法暂行.DOC
- 南京健友两学一做党员活动日.PPT
- 基于创业能力为核心的地方高校创新创业教育体系构建-阜阳师范学院.PDF
- 基于史密斯政策执行过程模型的大学生创业政策执行-科技促进发展.PDF
- 基于图割和边缘行进的肝脏CT序列图像分割Liver-电子与信息学报.PDF
- 基于学生自主学习的高校图书馆知识服务模式构建-图书情报工作.PDF
- 基于意象知识的消歧体系-第四纪研究.PDF
- 基于科学与工程实践的跨学科探究式学习-自然科学博物馆研究-中国.PDF
- 基于维基百科的领域本体自动构建方法研究-计算机应用与软件.PDF
- 基于紧身衣的人体动画研究A-软件学报.PDF
- 基于网络照片数据的城意象研究-BeijingCityLab.PDF
- 基于进化计算的卡通人物造型设计基于进化计算的卡通-计算机工程.PDF
文档评论(0)