【精品】东京大学86 .pptVIP

  • 3
  • 0
  • 约1.39万字
  • 约 69页
  • 2015-08-01 发布于河南
  • 举报
【精品】东京大学86 .ppt

東京大学 情報基盤センター (総合文化研究科、情報学府 兼担) 中川裕志 nakagawa@r.dl.itc.u-tokyo.ac.jp http://www.r.dl.itc.u-tokyo.ac.jp/~nakagawa/ 自動文書要約 一見、難しそうな処理だが、大変古くから研究されてきた。 1953年には既にIBMのLuhnによって、単語の重要度を定義し、重要な単語を多く含む文を文書から抽出するという方法で、かなり質のよい要約文が作られていた。 Luhnは、 中程度の頻度の単語が現れること 文書の先頭に近いほうが望ましい という2点を考慮してスコアの高い文を抽出した。 現在でも基本的には踏襲。 自動要約の応用分野 ある分野のサーベイの自動生成 cf. e-science 会議議事録の自動生成 携帯端末への要約テキスト表示 音声表示(要約しないと読み上げでは長い時間がかかる) 高齢者や児童への手短かつ分かり易い表現(言い換えも含む) 字幕の自動生成 ニュースやドラマなどのビデオコンテンツの要約(skimming) 要約例 新幹線の車両ドアの上の液晶ディスプレイでのニュース表示 インターネットに配信されているメールマガジンの見出し iモードのニュースは通常のニュースの要約 などなど 次のものは作り物の例 要約の機能 Indicative その文書を読むべきかどうかの判断材料を与

文档评论(0)

1亿VIP精品文档

相关文档