- 1
- 0
- 约4.16千字
- 约 48页
- 2018-02-16 发布于天津
- 举报
自然言语处理2007
日本語における字種 区切り記号(句読点、特殊記号) 漢字、片仮名、アルファベット(英文字) 数字 平仮名 * 形態素解析結果の第一次近似解を得るヒューリスティック(heuristic) 平仮名から他の文字種への変わり目 区切り記号の前後 非平仮名列から数字列への変わり目 数字列から非平仮名列への変わり目 以後、さらに精度を高める。何をすればいいのか? 考えてみよう。 * 前記ヒューリスティック適用例 文字種類の変わり目を単語の切れ目とする考え方。切り出した後、微修正が必要。 文字種類の/変わり/目を/単語の/切れ/目とする/考え/方/。/切り/出した/後/、/微修正が/必要/。/ 文字種類 / の / 変 / わり / 目 / を / 単語 /の / 切 / れ / 目 / とする / 考 / え / 方 / 。 / 切 / り / 出 / した / 後 / 、 / 微修正 / が / 必要 / 。 * 問題:文字種法の長所?短所 長所は、... 短所は、... * 問題:文字種法の改良案を考えよ。 (例に基づいて考えること) * 問題:文字種法の適用分野はあるか? もしあるとすれば何? * 最長一致法 処理対象文字列の先頭から始まる単語のうち、文字列長が最大のものを優先的に単語候補とする方法。 * 例 アルプスのやまは美しい アルプスの少女は
原创力文档

文档评论(0)