數位典藏國家型科技計畫 - 視障數位有聲書資料庫平台.docVIP

數位典藏國家型科技計畫 - 視障數位有聲書資料庫平台.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
數位典藏國家型科技計畫 (利用台灣現有視障用數位典藏資料製作盲人電子書-語音、點字及文字的自動排比—用以大量製作盲人電子書_子計畫三) 期中工作執行報告書 中華民國 年月日 目 錄 壹、基本資料 1 貳、計畫目的、計畫架構與主要內容 2 一、計畫目的 2 二、計畫架構 3 三、主要內容 5 參、期中執行成果 7 一、數位化資源架構調查 7 二、重要績效指標 8 三、典藏加值現況 11 四、年度工作甘梯圖 12 肆、檢討與建議事項 13 一、執行檢討 13 二、建議應用服務分項計畫提供之協助 13 三、其他建議 13 壹、基本資料 計畫名稱:執行單位::計畫期間: 核定經費: 實際支用金額:填表人: 聯絡電話:E-mail: 貳、計畫目的、計畫架構與主要內容 一、計畫目的 ,, 但礙於錄音者在錄音的過程中的種種個人習慣或環境因素所造成各個錄音檔的差異性,在自動化的過程中難免顧此失彼,無法保證有百分之百正確的效果。故藉由視障朋友的幫助來做校對的工作,此舉不但能使自動化輸出的結果能更符合原始文章的架構,同時還能有提升視障者工作職能的效果,使其不再侷限於只能從事像按摩等一般人刻板印象中,盲人所能做的工作。 所以提出本研究計畫,其目的為發展一個自動把語音、點字或文字對齊的工具和一個方便盲人編輯語音的工具程式。而這裡所謂的對齊是指把語音的與其相對應的點字或文字內容排比對齊,也就是段落對齊段落、停頓處對齊標點符號以及語音內容對到文字相對應的部分。(清大盲友會:約一萬本;彰化師大:約九千本)和淡江大學所提供的點字書約一萬本,這數量與日俱增,但囿限於人力所錄製的有聲書依然只能做十分原始的應用,無法發揮更高的學習價值。如今因應數位資訊時代的來臨,有聲書的錄製應跳脫傳統卡式錄音帶只能線性閱讀的束縛,予以數位化以便進一步加入多媒體等智慧化學習的功能進而提供盲友更為舒適有效率的學習環境。 二、計畫架構WAVE聲音檔案格式。考慮到程式方便於實做和最後對齊的效果,我們選取無背景音樂或背景音樂和錄音者的聲音是不同音軌的WAVE檔來處理。這樣能更正確的辨識出語音和文字相對應的部份;而文字的資料來源有兩種,一種是純文字,這類來源多是由該圖書的出版商提供,因為這種取得途徑有操作上的困難,所以我們也考慮資料來源是點字檔。在文字和WAVE檔的內容都相同的情況下,用WAVE檔裡的停頓處切割成數各區塊,同時也對文字檔以相對應的標點符號來切割成數塊,最後輸出對齊結果,下圖是整體的流程: 結束時間 文字內容 00001815 我喜歡旅行 00005145 而且特別喜歡去荒野的地方 00015958 荒野之旅就是描述… … 三、主要內容 (,。..)的位置,把兩個標點符號當作一個區塊切下來,視其為一各可能的停頓處。這裡除了要考慮眾多的標點符號,那些才是一般在說話時會停頓處之外,還要考慮每各檔案裡不同的全型或半型,甚至於混合的標點符號格式。處理過後會輸出一個如上圖一般的檔案。 而對於對齊WAVE的單一個文字區塊,我們考慮如下的三種情況: 有了這三種情況後,我們發現這跟一般很常用的序列比對很相似。同樣地,我們也考慮利用動態規劃(Dynamic Programming)的方法來實作。先令文字檔的區塊個數為b(T),WAVEb(W)且令文字區塊從1,2,..,i和WAVE區塊從1,2,….,j最好的對齊方式為BA(i,j),則考慮如上的三種情況後可以訂出如下的遞迴關係式: 其中α,β,P合併和P跳過皆是O(n3)的時間裡完成,這對演算法的分析來說是線性的時間,是不錯的結果,但考慮到WAVE檔所切出的區塊數會非常龐大,以實作的觀點來看,我們還必須加上一些小技巧以確保在往後大量執行時不至於需要等待無法忍受的時間。參考到一些做序列比對的技巧和我們問題的特性,因為當初是估計最小停頓來切斷WAVE區塊,所以多個文字區塊對應到單一個WAVE區塊可說是相當少發生:此外,WAVE區塊個數也有相當的限制,所以我們大可以把計算量限制在主對角線的某個範圍內(如下圖),如此除了節省時間外,也節省了空間。 待前述的自動排比程式完成輸出起始、終止時間和句子的對應檔後,再交給視障者來進行摸讀的工作。此舉有兩個目的,第一個是在摸讀的過程中,校對排比對齊的結果。這可近一步排除當初錄製時的種種人為或環境因素所造成的自動排比錯誤的情況,可大大提高對齊的準確度。其二是利用子計畫一所定義出來的DAISY格式,在適當的地方標記章、節或篇等的資訊,這有助於方便的套用到DAISY電子書格式。而這兩項工作都有賴於一個能使視障朋友方便編輯、加註記和撥放WAVE並能同時結合文字或點字顯示的工具程式,所以這個程式的發展時間點需仰賴子計畫一把DAISY格式初步定義好

文档评论(0)

***** + 关注
实名认证
文档贡献者

本账号下所有文档分享可拿50%收益 欢迎分享

1亿VIP精品文档

相关文档