基于文本语义的复杂实体识别系统的设计与实现-东北大学毕业设计(论文)答辩演示课件文.pptxVIP

  • 5
  • 0
  • 约1.75千字
  • 约 25页
  • 2018-02-28 发布于天津
  • 举报

基于文本语义的复杂实体识别系统的设计与实现-东北大学毕业设计(论文)答辩演示课件文.pptx

毕业论文答辩题目:基于文本语义的复杂实体识别系统的设计与实现答辩人:XXX导 师:XXX (副)教授答辩提纲1课题研究的主要内容2系统相关技术与算法3系统功能结构与模块设计4训练数据集与结果分析课题研究内容 本课题研究的是复杂数据上的实体识别技术,即基于文本在语义上的特征来实现对文本数据的识别,具体可分为以下两个方面:(1)构建文本向量空间模型,分析两个文本在语义上的相似性,判断是否同一类型。(2)构建词向量空间模型,分析文本-类别相似度,对未知文本进行分类。相关技术复杂数据上的实体识别技术(XML数据、图数据、文本数据)(1)成对的实体识别:相似性算法实现(2)成组的实体识别:构建分类模式实现相关算法(1)余弦相似算法: 基于文本向量空间模型的分析方法,利用向量运算简化文本运算。(2)Jaccard相似算法:从集合角度分析文本相似的方法,利用集合运算简化文本运算。(3)基于词向量空间模型(WVSM)的文本分类算法:构建分类模式来进行文本分类。根据支持度矩阵,计算文本-类别相似度对训练文本进行预处理,生成词列表根据特征词向量,计算支持度矩阵计算信息增益(IG),选择特征词根据特征词列表,生成特征词向量系统功能结构主窗体文本分类模块相似分析模块预处理模块单个文本分类批量文本分类杰卡德相似分析词频分析分词处理文本浏览余弦相似分析词性过滤文本浏览系统处理流程文本数据(成组的实体识别)(

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档