北京语言大学计算机系语言信息处理研究所当前研究工作介绍研究.pdfVIP

  • 29
  • 0
  • 约1.32万字
  • 约 8页
  • 2018-01-04 发布于广东
  • 举报

北京语言大学计算机系语言信息处理研究所当前研究工作介绍研究.pdf

北京语言大学计算机系语言信息处理研究所 当前研究工作介绍 宋柔 (北京语言大学计算机系语言信息处理研究所,100083) E-mail:.sonx—rou(一,,blcu.edu.cn 摘要:本文介绍北京语言大学计算机系语言信息处理研究所近来的研究工作,包括百科辞典 知识提取,文本按语体分类,面向语言教学研究的汉语语料库检索工具,分词和简单短语归 并. 、 关键词:知识提取;文本分类;语料库检索;分词;简单短语 1.百科辞典知识提取 本课题研究百科辞典的知识提取,处理对象是《中国大百科全书》(光盘版),采用的方 法是:(1)根据词目确定题材类别,根据题材类别确定知识提取的目标;(2)建立基于词汇 语义的形式系统,用词语模式匹配的方法提取知识。本文介绍了相关研究的一些实验,测试 结果证明这一方法是有效的。 1.1.百科辞典词目按题材的分类 为了提取知识的方便,首先需要把按领

文档评论(0)

1亿VIP精品文档

相关文档