- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
The 2017 Conference on Computational Linguistics and Speech Processing
ROCLING 2017, pp. 119-135
The Association for Computational Linguistics and Chinese Language Processing
基於 i-vector 與 PLDA 並使用 GMM-HMM 強制對位之
自動語者分段標記系統
Speaker Diarization based on I-vector PLDA Scoring and
using GMM-HMM Forced Alignment
張乘若 1
Cheng-Jo Ray Chang
2
李鴻欣 Hung-Shin Lee
2
王新民 Hsin-Min Wang
張智星 Jyh-Shing Roger Jang1
1 國立台灣大學資訊工程學系 Department of Computer Science and Information
Engineering, National Taiwan University
2 中央研究院資訊科學研究所
Institute of Information Science, Academia Sinica
摘要
近年來,i-vector 搭配PLDA (Probability Linear Discriminant Analysis )的系統已經
在自動語者分段標記(Speaker Diarization )的研究上獲得了很好的結果。不過 ,由於i-
vector 需要由較長的音訊片段抽取出來才具有較佳的語者特性,所以較無法有效地處理
時間極短的語句區段。為此,本論文提出一個新的自動語者分段標記框架:先由K 平均
(K-means )演算法得到初步的自動語者分段標記結果,並據此建立初步語者模型,再
配合利用GMM-HMM (Gaussian Mixture Models-Hidden Markov Models )進行強制對位
(Forced Alignment )以及語者分群(Speaker Clustering )來進行自動語者分段標記 。從
實驗上我們可以發現 ,雖然單獨利用GMM-HMM 語者分群並未比使用GMM-HMM 強
制對位所得到的召回率(Recall )以及精準率(Precision )來得好,但是利用GMM-HMM
語者分群的結果再重新進行 GMM-HMM 強制對位卻可以得到較好的召回率以及精準
率,故由GMM-HMM 語者分群以得到更細小的語者說話區段對自動語者分段標記的問
題是有幫助的。此外,這篇論文也探討針對不同時間長度的音訊片段對自動語者分段標
記的影響。
關鍵字:自動語者分段標記,I-vector ,PLDA ,GMM-HMM ,強制對位,語者分群
119
一、緒論
隨著時代不斷的演進,人們在處理語音的技術也愈來愈成熟。就拿語者辨識
(Speaker Recognition )的領域來講,從當初使用藉著高斯混合模型(Gaussian Mixture
Models, GMM )[1] 來建立廣義背景模型 (Universal Background Models, UBM ),及至聯
合因素分析(Joint Factor Analysi
您可能关注的文档
最近下载
- 大麦EK318.操作手册.C01.220905.pdf
- 五马先生纪年.docx VIP
- 急救与心理技能(视频课)知到课后答案智慧树章节测试答案2025年春中南大学.docx VIP
- 应急救援员国家职业技能标准(2019年版).pdf VIP
- 场地设计作图题-一级建筑师场地设计(作图题)真题精选.docx VIP
- 小学环境教育:校园内水体污染调查与水质保护实践教学研究课题报告.docx
- 阿迪达斯(Adidas)品牌现状分析与二次增长战略规划.pptx
- 人教版七年级上册数学一元一次方程计算题及应用题.docx VIP
- 人教版2025八年级上册英语Unit3 same or different单元复习课件.pptx VIP
- 濒危古树评估与抢救保护技术规程.docx VIP
文档评论(0)