基于先秦语料库的古汉语地名自动识别模型构建研究-中国人民大学.pdfVIP

下载本文档

37
0
约2.81万字
约 6页
2017-10-30 发布于天津
举报

基于先秦语料库的古汉语地名自动识别模型构建研究-中国人民大学.pdf

基于先秦语料库的古汉语地名自动识别模型构建研究-中国人民大学

第５９卷第１２期　２０１５年６月基于先秦语料库的古汉语地名自动识别模型构建研究 ■ 黄水清　王东波　何琳南京农业大学信息科学技术学院　南京２１００９５摘要：［目的／意义］在数字人文研究这一大趋势下，基于先秦古汉语语料库和条件随机场模型，构建古汉语地名自动识别模型。［方法／过程］对《春秋左氏传》中的地名的内部和外部特征进行统计分析，构建模型的特征模板。在规模为１８７９０１个词汇的训练和测试语料上，对比条件随机场模型和最大熵模型的地名识别效果，把调和平均数为９０．９４％的条件随机场训练模型确定为最佳，作为本文所要构建的模型，并在《国语》语料上进行验证。［结果／结论］在古汉语地名自动识别中，条件随机场模型优于最大熵模型，基于人工标注过的语料构建条件随机场自动识别模型能取得较好的识别效果。关键词：古汉语地名　条件随机场　词汇特征　先秦语料库分类号：Ｇ２５５．１　　ＤＯＩ：１０．１３２６６／ｊ．ｉｓｓｎ．０２５２－３１１６．２０１５．１２．０２０［６］１　引言

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

基于先秦语料库的古汉语地名自动识别模型构建研究-中国人民大学.pdfVIP

基于先秦语料库的古汉语地名自动识别模型构建研究-中国人民大学.pdf

您可能关注的文档

最近下载

文档评论（0）

1亿VIP精品文档

相关文档