- 8
- 0
- 约1.86千字
- 约 25页
- 2018-02-21 发布于湖北
- 举报
基于文本语义的复杂实体识别系统的设计与实现-东北大学毕业设计(论文)答辩
毕业论文答辩
题目:基于文本语义的复杂实体识别系统的设计与实现
答辩人:XXX
导 师:XXX (副)教授
1
1
课题研究的主要内容
2
系统相关技术与算法
3
系统功能结构与模块设计
4
训练数据集与结果分析
答辩提纲
2
课题研究内容
本课题研究的是复杂数据上的实体识别技术,即基于文本在语义上的特征来实现对文本数据的识别,具体可分为以下两个方面:
(1)构建文本向量空间模型,分析两个文本在语义上的相似性,判断是否同一类型。
(2)构建词向量空间模型,分析文本-类别相似度,对未知文本进行分类。
3
相关技术
复杂数据上的实体识别技术(XML数据、图数据、文本数据)
(1)成对的实体识别:相似性算法实现
(2)成组的实体识别:构建分类模式实现
4
相关算法
(1)余弦相似算法: 基于文本向量空间模型的分析方法,利用向量运算简化文本运算。
(2)Jaccard相似算法:从集合角度分析文本相似的方法,利用集合运算简化文本运算。
(3)基于词向量空间模型(WVSM)的文本分类算法:构建分类模式来进行文本分类。
对训练文本进行预处理,生成词列表
计算信息增益(IG),选择特征词
根据特征词列表,生成特征词向量
根据特征词向量,计算支持度矩阵
根据支持度矩阵,计算文本-类别相似度
5
系统功能结构
主窗体
文本分类模块
相似分析模块
预处理模块
文本浏览
分词处理
词性过滤
词频
您可能关注的文档
- 众信旅游:北京市金杜律师事务所关于公司首次公开发行股票并上市的律师工作报告.pdf
- 公司战略与风险管理--第3章--第3节.ppt
- 出口德国计划书.doc
- 劲胜股份:关于使用自有资金对消费电子产品金属精密结构件项目追加投资的可行性研究报告.pdf
- 北京国枫凯文(深圳)律师事务所关于宁波普诺生物医药有限公司的法律尽职调查报告.pdf
- 北 海 港:钦州市港口(集团)有限责任公司审计报告.pdf
- 北京市时代九和律师事务所关于公司首次公开发行人民币普通股(A股)股票并在创业板上市之律师工作报告.pdf
- 北京旅游:2011-2012年度及2013年1-11月财务报表审计报告.pdf
- 北京市金杜律师事务所关于公司首次公开发行(A股)股票并上市之律师工作报告.pdf
- 北京市柯杰律师事务所关于公司现金和发行股份购买资产暨吸收合并的法律意见.pdf
- 专项十三 复合句(含答案) 2026年中考人教版英语语法专项复习.doc.docx
- 专项十四 There be句型和主谓一致(含答案) 2026年中考人教版英语语法专项复习.doc.docx
- 专项14 构词法 学案(含答案)2025年中考人教版英语语法专项复习.doc.docx
- 静脉肾盂造影结石梗阻评估.ppt
- 《假期实践活动》教案-2025-2026学年冀教版(新教材)小学数学二年级下册.docx
- 老年结石病合并慢病综合诊疗.ppt
- 鹿角形肾结石复杂手术治疗.ppt
- 经皮肾镜超声碎石清石术.ppt
- 《参观爱国主义教育基地》教案-2025-2026学年冀教版(新教材)小学数学二年级下册.docx
- 《生活中的大数:整理与复习》教案(2课时)-2025-2026学年冀教版(新教材)小学数学二年级下册.docx
原创力文档

文档评论(0)