面向綜合語言知識庫建設的漢語詞義消歧與標注語言模型研究.pptVIP

  • 2
  • 0
  • 约1.91万字
  • 约 102页
  • 2017-04-07 发布于天津
  • 举报

面向綜合語言知識庫建設的漢語詞義消歧與標注語言模型研究.ppt

面向綜合語言知識庫建設的漢語詞義消歧與標注語言模型研究

面向综合语言知识库建设的 汉语词义消歧与标注语言模型研究 北京大学计算语言学研究所 张仰森 2006-11-28 内容提要 一、 绪 论 二、 国内外研究现状分析 三、 词语义项的表征及其可计算性 四、 基于多知识源的知识提取与融合 五、 面向汉语词义排歧与标注的语言模型 六、 标注语料的一致性保证与正确性评价 七、 面向真实文本的汉语词义标注实验系统的设计与实现 八、 结 束 语 一、国内外研究现状 基于规则的词义消歧方法 基于词典知识的词义消歧方法 有指导的统计词义消歧方法 无指导的统计词义消歧方法 现有研究存在的问题与改进策略 伪词法---可解决训练语料不足的问题 少数几个词---只适于对消歧算法的研究 二、我们的目标、优势及对策 研究的目标与内容 目标:建设高质量的大规模汉语综合语言知识库 内容:汉语语料库建设过程中汉语词义消歧与标注的基本方法和关键技术。 所具有的优势 人员优势:文理交叉; 资源优势:世界上最大的标注语料库,语法信息词典等 二、我们的目标、优势及对策 拟解决的问题 知识源的选择; 基于多知识源的知识提取与融合; 基于知识的词义消歧模型与算法; 模型的评价与一致性检验方法 研究方法与技术路线 开发试验平台用于模型与算法的实验研究; 采用同形标注与义项标注两步走战略; 内容提要 一、 绪 论 二、 国内外研究现状分析 三、 词语义项的

文档评论(0)

1亿VIP精品文档

相关文档