基于文本语义的复杂实体识别系统的设计与实现-东北大学毕业设计(论文)答辩.pptVIP

  • 8
  • 0
  • 约1.86千字
  • 约 25页
  • 2018-02-21 发布于湖北
  • 举报

基于文本语义的复杂实体识别系统的设计与实现-东北大学毕业设计(论文)答辩.ppt

基于文本语义的复杂实体识别系统的设计与实现-东北大学毕业设计(论文)答辩

毕业论文答辩 题目:基于文本语义的复杂实体识别系统的设计与实现 答辩人:XXX 导 师:XXX (副)教授 1 1 课题研究的主要内容 2 系统相关技术与算法 3 系统功能结构与模块设计 4 训练数据集与结果分析 答辩提纲 2 课题研究内容 本课题研究的是复杂数据上的实体识别技术,即基于文本在语义上的特征来实现对文本数据的识别,具体可分为以下两个方面: (1)构建文本向量空间模型,分析两个文本在语义上的相似性,判断是否同一类型。 (2)构建词向量空间模型,分析文本-类别相似度,对未知文本进行分类。 3 相关技术 复杂数据上的实体识别技术(XML数据、图数据、文本数据) (1)成对的实体识别:相似性算法实现 (2)成组的实体识别:构建分类模式实现 4 相关算法 (1)余弦相似算法: 基于文本向量空间模型的分析方法,利用向量运算简化文本运算。 (2)Jaccard相似算法:从集合角度分析文本相似的方法,利用集合运算简化文本运算。 (3)基于词向量空间模型(WVSM)的文本分类算法:构建分类模式来进行文本分类。 对训练文本进行预处理,生成词列表 计算信息增益(IG),选择特征词 根据特征词列表,生成特征词向量 根据特征词向量,计算支持度矩阵 根据支持度矩阵,计算文本-类别相似度 5 系统功能结构 主窗体 文本分类模块 相似分析模块 预处理模块 文本浏览 分词处理 词性过滤 词频

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档