- 0
- 0
- 约5.36千字
- 约 42页
- 2017-02-16 发布于湖北
- 举报
中英多文件摘要系統之研究 指導教授:陳信希博士 研究生:蘇哲君 動機(想法的出發點) 大量資料充斥 雙語(多語)的閱讀人口大量增加 但每人還是有特定一種的偏好語言 透過文件的分析,將文件以最大的彈性來呈現,降低語言之間的隔閡所造成的影響。 先前的研究 本實驗室 (Chen, Chen, Huang and Lin, 1998) 以句子中的名詞和動詞來計算句子的重要性,藉以產生文件的摘要。 本實驗室 (黃聖傑, 1999) 多文件自動摘要方法研究 目標 一個跨語言的文件瀏覽系統 將來自不同語言的新聞文件依事件加以分群 分析描寫同一事件的每篇文章之間的異同 文件摘要的呈現 架構 主要課題 如何將中英文件轉換成「可比較的文件」? 中英文間如何評量相似程度? 字(詞)的層次 語句的層次 文件的層次 摘要的呈現方式 文件前置處理 擷取資料 資料來源: 中文:中央社中文新聞、中央日報、中國時報中文新聞、聯合報(中英對照中文部分) 英文:中央社英文新聞、ChinaPost、中國時報英文新聞、聯合報(中英對照英文部分) 針對每家不同來源的新聞(html)作文章擷取的動作 文件前置處理 將來自中文與英文的文件經過處理成為可比較的單位 文件前置處理(中文部分) 句子(義元)的切割(黃聖傑, 1999) 中文的句子中,往往一句中含有多個的含義 而在國政基金會民調中,受訪者也同時對民進黨缺乏人才表達憂
您可能关注的文档
最近下载
- 2025年重庆市中考数学试卷(含答案).pdf
- 2026年危险化学品生产单位主要负责人试题(含答案及解析).docx VIP
- Unit3EnvironmentalProtectionUsinglanguageReadingforwriting课件高中英语人教版选择性必修第三册.pptx VIP
- 成都铁路局2025年招聘全日制大专高职毕业生试题及答案解析.docx VIP
- 内蒙古师范大学2025年《高等数学》期末试卷(A卷).docx VIP
- 零售行业报刊业务员学习资料零售(中级)学习资料含答案.pdf VIP
- 医疗机构医疗纠纷应急处置预案.pdf VIP
- Harold & Kumar Escape from Guantanamo Bay《猪头逛大街2(2008)》完整中英文对照剧本.docx VIP
- 【2017年整理】北航《误差理论与数据处理》.doc VIP
- 2024-2025学年河南省南阳市唐河县统编版六年级下册期中考试语文试卷.doc VIP
原创力文档

文档评论(0)