改良语句模型技术于节录式语音摘要之研究improvedsentence.pdfVIP

改良语句模型技术于节录式语音摘要之研究improvedsentence.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
改良语句模型技术于节录式语音摘要之研究improvedsentence

Proceedings of the Twenty-Fifth Conference on Computational Linguistics and Speech Processing (ROCLING 2013) 改良語句模型技術於節錄式語音摘要之研究 Improved Sentence Modeling Techniques for Extractive Speech Summarization 劉士弘 Shih-Hung Liu, 陳冠宇 Kuan-Yu Chen, 王新民 Hsin-Min Wang, 許聞廉 Wen-Lian Hsu 中央研究院資訊科學研究所 {journey, kychen, whm, hsu}@.tw 陳柏琳 Berlin Chen 國立臺灣師範大學資訊工程學系 berlin@.tw 摘要 由於網際網路的蓬勃發展與海量資料時代的來臨,近幾年來自動摘要 (Automatic Summarization)已儼然成為一項熱門的研究議題。節錄式(Extractive) 自動摘要是根據事 先定義的摘要比例,從文字文件(Text Documents)或語音文件(Spoken Documents) 中選取 一些能夠代表原始文件主旨或主題的重要語句當作摘要。在相關研究中,使用語言模型 (Language Modeling)結合庫爾貝克-萊伯勒離散度(Kullback-Leibler Divergence)的架構來 挑選重要語句之方法,已初步地被驗證在文字與語音文件的自動摘要任務上有不錯的成 果。基於此架構,本論文探究語句明確度(Clarity)資訊對於語音文件摘要任務之影響性, 並進一步地藉由明確度的輔助來重新詮釋如何能在自動摘要任務中適當地挑選重要且 具代表性的語句。此外,本論文亦針對語句模型的調適方法進行研究;在運用關聯性 (Relevance)的概念下,嘗試藉由每一語句各自的關聯性資訊,重新估測並建立語句的語 言模型,使其得以更精準地代表語句的語意內容,並增進自動摘要之效能。本論文的語 音文件摘要實驗語料是採用公視廣播新聞(MATBN) ;實驗結果顯示,相較於其它現有 的非監督式摘要方法,我們所發展的新穎式摘要方法能提供明顯的效能改善。 關鍵詞:節錄式自動摘要、語言模型、庫爾貝克-萊伯勒離散度、語句明確度、關聯性 一、緒論 隨著海量資料時代的來臨,巨量的文字及多媒體影音資訊被快速地傳遞並分享於全球各 地,資訊超載(Information Overload)的問題也因此產生。如何能讓人們快速且有效率地 瀏覽與日俱增的文字資訊或多媒體影音資訊,已成為一個刻不容緩的研究課題。在眾多 的研究方法中,自動摘要(Automatic Summarization)被視為是一項不可或缺的關鍵技術 [16] 。自動摘要之目的在於擷取單一文件(Single-Document)或多重文件(Multi-Document) 中的重要語意與主題資訊,藉此讓使用者能更有效率地瀏覽與理解文件的主旨,以便快 速地獲得其所需的資訊,避免花費大量時間在審視文件內容。另一方面,語音是多媒體 文件中最具資訊的成分之一;如何透過語音(文件)摘要技術來自動地、有效率地處理具 時序性的多媒體影音內容,例如:電視新聞、廣播新聞、郵件、電子郵件、會議及演講 5 Proceedings of

您可能关注的文档

文档评论(0)

zhuwo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档