Advisor:蔡宗翰 教授Speaker:陈建廷.pptVIP

  1. 1、本文档共30页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* * * * * 舉例、貼圖? * * * * * * * * 有點空 有點抽象 舉個例子? * * * * * * * 問卷內容: 1.我喜歡利用影片的摘要來幫助我瞭解影片內容。 2.藉由影片的摘要,使我更容易瞭解影片的內容。 3.在參考影片的摘要後,對我而言瞭解影片內容是容易的事。 4.使用影片的摘要來幫助我理解影片內容時,讓我感到在影片內容上能瞭解更多。 5.使用影片的摘要來幫助我理解影片內容時,讓我感到非常有效率。 6.藉由影片的摘要來幫助我瞭解影片內容時,能激起我對影片內容的興趣。 7.日後我期望能藉由影片的摘要來輔助我瞭解影片的內容。 * * * * * * * * * 基於專有名詞翻譯 之中韓跨語言多媒體檢索系統 A Chinese-Korean Cross-language Media Retrieval System Based on Name Entity Translation Methods Outline Background Motivation Target Method Experiment and Evaluation Result Discussion Conclusion Background 韓國文化廣受歡迎 衣著 食物 戲劇 歌曲 韓語能力普遍不足 漢字幾乎淘汰 Motivation Nobody Motivation (cont.) wonder girls ?神奇女孩 Motivation (cont.) ???? Target 多媒體影音檢索系統 中文輸入 韓語資訊 韓語檢索 中文輸出 Method Method (cont.) 查詢語句處理 中研院中文NER工具 專有名詞翻譯 Wikipedia 元件 Pattern Translation 元件 Method (cont.) Wikipedia 元件 Method (cont.) Pattern Translation 元件 收集中韓專有名詞對照作為訓練集 送入AltaVista 搜尋引擎搜尋 從回傳資料取出詞對出現的句子 將取出的句子兩兩做Smith-Waterman local alignment演算法以產生模板(pattern) 給定模板權重 Method (cont.) Smith-Waterman local alignment演算法範例 全度妍(???) 九三年出道,畢業於首爾藝術大學。 主演:全度妍(???)、崔岷植(???)、朱鎮模(???) 上述二句經過local alignment後,可得到: 全度妍(???) 故可歸納出一模板如下: 中文專有名詞(韓文翻譯) Method (cont.) Method (cont.) 韓文斷詞 空白 韓文詞性標注 POSTAG (by POSTECH) 韓文翻譯中文 Wikipedia 元件 Pattern Translation 元件 Naver 中國語辭典 + Google Translation Mutual Information 算分公式 Method (cont.) Mutual Information “c+k”送入Altavista做檢索 c與k同時出現的頻率 Experiment 訓練集 自Naver搜尋引擎中蒐集120組中韓專有名詞組 如:言承旭 ??? 經過local alignment 演算法產生模板 給定模板權重 將中文查詢詞與模板送入Altavista搜尋引擎檢索 將搜尋結果根據正確率給定模板權重 Experiment (cont.) 測試集 半年內各大網路媒體韓國影視娛樂新聞文章 製作成NTCIR格式 Experiment (cont.) 起始標記 結束標記 意 義 TOPIC /TOPIC 標記一份資料開始與結束 NUM /NUM 資料流水號 LANG /LANG 資料語言 TITLE /TITLE 資料標題 DESC /DESC 資料描述 BACK /BACK 資料背景 Experiment and Evaluation 中韓跨語翻譯機制評估 Top 10 Average Precision 韓中跨語翻譯機制評估 User Opinion Questionnaire? Experiment and Evaluation(cont.) 中韓跨語翻譯機制評估 由蒐集到的200則文章中隨機抽取20則 將title部份送入系統做測試 取前十則影片來計算 該題的Average Precision 將所有題目的Precision作平均 中韓翻譯機制 Top-10 Average Precision 本專題系統 39.875% Google Translate 14% Experiment and E

文档评论(0)

1234554321 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档