- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
 - 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
 - 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
 
                        查看更多
                        
                    
                运用Python结合语音辨识及合成技术于自动化音文同步之实作A
                    
          The 2015 Conference on Computational Linguistics and Speech Processing 
          ROCLING 2015, pp. 289-305 
           The Association for Computational Linguistics and Chinese Language Processing  
                 運用Python 結合語音辨識及合成技術 
                        於自動化音文同步之實作 
 A Python Implementation of Automatic Speech-text Synchronization  
      Using Speech Recognition and Text-to-Speech Technology  
                              賴俊翰    Chun-Han Lai  
                             長庚大學資訊工程學系  
             Department of Computer Science and Information Engineering  
                              Chang Gung University  
                              j79916 @  
                             張朝凱    Chao-Kai Chang  
                             長庚大學資訊工程學系  
             Department of Computer Science and Information Engineering  
                              Chang Gung University  
                             aw  
                              呂仁園    Renyuan Lyu  
                             長庚大學資訊工程學系  
             Department of Computer Science and Information Engineering  
                              Chang Gung University  
                             renyuan.lyu@  
                                     摘要  
本研究設計一個方便處理有聲書音文同步的技術,利用雲端的文字轉語音(Text-to-speech)技術, 
結合語音辨識(Speech Recognition)技術,讓使用者能夠使用自行準備的文章來製作自己的『跟 
述練習』(Shadowing  technique)的學習素材,製作達到詞層級(Word-level)的音文同步有聲書。 
此音文同步有聲書是藉由『帶時間點的文字』  (Timed-text)檔案所製作,而帶時間點的文字則 
是由使用者所提供的文章連同對應的語音聲波檔案,經由一套名為 CGUAlign  的音文同步技 
術之處理所產生的。CGUAlign 是運用Python  將一有名的語音辨識技術─HTK(Hidden Markov  
Model Toolkit)  包裝,只要提供文字檔及其朗讀的語音檔,其中語音檔是經由雲端語音合成技 
術而得來的,即能製作出音文同步的帶時間點的文字檔案,隨後,我們也建立一個簡易的以 
JavaScript  製作的網站,能夠運用這個檔案做電腦輔助語言學習(Computer-assisted  language  
learning, CALL)之用,此網站能夠閱讀音文同步有聲書,讓使用者能夠較輕鬆的做跟述練習 , 
最後我們也提供即時翻譯的功能來達到電腦輔助語言學習的目標。  
                                       289 
  
                                          Abstract  
In this study, we establish a method to create speech and text synchron
                您可能关注的文档
最近下载
- 驱鸟模块考核试题含答案.doc VIP
 - 2015恒星结构与演化2018introduction.pdf VIP
 - 破伤风的临床表现及护理.pptx
 - 2025兴业银行总行国际业务部交易银行部招聘考试备考题库及答案解析.docx VIP
 - 技术作品(产品)说明书及其编写课件-高中通用技术必修《技术与设计1》.pptx
 - 人教版(2024新版)九年级上册化学:第六单元 课题2《碳的氧化物》教案教学设计.docx VIP
 - 2025兴业银行福建总行国际业务部交易银行部招聘若干人备考题库及答案解析.docx VIP
 - 2025年《卵巢恶性肿瘤诊断与治疗指南(第四版)》要点.pdf VIP
 - 抗病毒药和抗真菌药.ppt VIP
 - 竞选学习委员ppt.pptx VIP
 
原创力文档
                        

文档评论(0)