毕业设计答辩 - 哈工大信息检索研究室.pptVIP

  • 107
  • 0
  • 约 20页
  • 2017-09-28 发布于广东
  • 举报

毕业设计答辩 - 哈工大信息检索研究室.ppt

毕业设计答辩 - 哈工大信息检索研究室.ppt

毕业设计答辩 题目:面向教师简历的关系抽取 提纲 课题介绍 系统总体介绍 关键技术 实验结果分析与改进 提纲 课题介绍 系统总体介绍 关键技术 实验结果分析与改进 课题介绍 传统关系抽取方法 有指导关系抽取 核方法 无指导关系抽取 序列模式学习算法 面向教师简历关系抽取 没有标注语料(无法采用机器学习方法) 引入搜索引擎机制 课题介绍 教师简历的实体类型: 课题介绍 本课题定义了7种教师简历实体关系: 提纲 课题介绍 系统总体介绍 关键技术 实验结果分析与改进 系统总体介绍 提纲 课题介绍 系统总体介绍 关键技术 实验结果分析与改进 关键技术 教师简历实体识别模块 基于动态词典的实体识别 技术:双数组Trie树 姓名、院系、职称、职务、性别、学位、学科 基于模板的实体识别 技术:正则表达式 电子邮箱: \b[A-Z0-9._%-]+@[A-Z0-9.-]+\.[A-Z]{2,4}\b 关键技术 特征提取 实体类型特征 选出有可能构成目标关系的候选实体对 实体距离特征 计算出候选实体对在一篇文档中的距离 实体共现概率特征 计算出候选实体对在语料中共同出现的概率 互信息模型 关键技术 搜索引擎的引入 关键技术 插件机制 关键技术 教师简历关系数据库 提纲 课题介绍 系统总体介绍 关键技术 实验结果分析与改进 实验结果分析与改进 人工标注200篇HTML文档作为测试集 处理

文档评论(0)

1亿VIP精品文档

相关文档