- 15
- 0
- 约5.01万字
- 约 79页
- 2019-03-10 发布于广西
- 举报
基于非结构化数据的多类型网络构建研究
PAGE
第 PAGE \* Arabic \* MERGEFORMAT 1 页第 PAGE \* Arabic \* MERGEFORMAT 1 页
密级: 保密期限:
硕士研究生学位论文
题目:基于非结构化数据的多类型网络
构建研究
学 号: 075885
姓 名: 吴广程
专 业:计算机科学与技术
导 师: 张雷
学 院: 计算机学院
2010年 1
第 PAGE \* Arabic \* MERGEFORMAT 59 页第 PAGE \* Arabic \* MERGEFORMAT 59 页第 PAGE \* Arabic \* MERGEFORMAT 59 页第 PAGE \* Arabic \* MERGEFORMAT 59 页第 PAGE \* Arabic \* MERGEFORMAT 59 页第 PAGE \* Arabic \* MERGEFORMAT 59 页
独创性(或创新性)声明
本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得北京邮电大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。
申请学位论文与资料若有不实之处,本人承担一切相关责任。
本人签名: 日期:
关于论文使用授权的说明
学位论文作者完全了解北京邮电大学有关保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许学位论文被查阅和借阅;学校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存、汇编学位论文。(保密的学位论文在解密后遵守此规定)
保密论文注释:本学位论文属于保密在 年解密后适用本授权书。非保密论文注释:本学位论文不属于保密范围,适用本授权书。
本人签名: 日期:
导师签名: 日期:
基于非结构化数据的多类型网络构建研究
摘 要
企业信息化与互联网的发展促使非结构化与半结构化数据不断增加。针对海量非结构化与半结构化数据进行挖掘分析成为近年来研究的热点。复杂网络与中文信息处理的最新研究成果为非结构化和半结构化数据挖掘提供了一个新方法和视角。即将中文信息处理技术与网络构建技术相结合,采用中文信息处理技术抽取非结构化数据中包含的信息,并构建网络进行分析,进一步挖掘其潜在信息。
分析复杂网络在不同领域的应用,其主要包括两个阶段:网络构建与网络分析。网络构建是指从实际应用数据中,建立个体之间相互联系,构建关系网络。这是复杂网络应用的基础与关键。因此本文将以非结构化数据为对象,研究利用中文信息抽取技术构建多类型网络。
首先,本文对文本聚类进行研究,并将其应用到数据集划分中,将数据集划分不同领域或主题的子数据集。通过对传统文本聚类的实现与分析,将复杂网络中的社区划分算法应用文本聚类中,实现基于社区划分算法的文本聚类,并取得一定的效果。
其次,本文采用中文信息抽取技术抽取非结构化数据包含的实体相关信息。由于网络构建中边的重要性,本文主要对实体关系抽取进行研究。对传统的无监督聚类实体关系抽取算法中的实体对上下文信息收集以及实体对聚类两阶段进行改进,更快、更好的抽取非结构化数据中包含的实体关系。同时针对单文档以及稀疏文档集,本文实现了基于事件框架的实体关系抽取,以抽取用户指定的特殊实体关系。
再者,通过比较复杂网络在不同领域的应用,分析与总结出常用的网络类型,即同质、异质、动态网络。根据非结构化数据的信息元素的多维性,从不同的视角与维度出发,构建了文档-文档关系网络、文档-实体关系网络、实体-实体关系网络以及动态网络。
最后,设计并实现多类型网络构建原型系统,将本文中的研究内容融入其中。分别对各研究内容与原型系统进行实验,以验证其有效性。
关键词:复杂网络 网络构建 实体关系抽取 文本聚类
THE RESEARCH OF MODELING MULTI-NETWORKS
BASED ON UNSTRUCTURED DATA
ABSTRACT
With the
您可能关注的文档
- 基于音圈电机驱动的高精度并联指向机构研制-汇总版v2.doc
- 基于机器视觉的复杂零件.docx
- 下一代互联网试点CN2网络评估报告.doc
- 基于嵌入式系统的机器视觉及其在机器人控制中的应用.docx
- 基于三维造型的自卸车举升装置机构分析与设计.doc
- 基于HALCON的机器视觉系统的研究与实现.docx
- 基于HALCON的机器视觉试验平台的设计与研究(1).docx
- 基于halcon的机器视觉试验平台的设计与研究.docx
- 基于切割器动态刚性的甘蔗收割机整机布局优化.doc
- 2026调味品行业市场现状分析及未来趋势与投资策略研究报告.docx
- 2026农资行业市场现状供需分析及投资评估规划分析研究报告.docx
- 2026煤炭气化供热工程服务行业供需状况研究及企业投资建议.docx
- 2026亚洲智能家居系统市场供需调研与发展潜力分析研究报告.docx
- 2026元宇宙概念落地应用与商业化路径研究报告.docx
- 2026宠物智能用品消费行为分析与品牌竞争策略报告.docx
- 2026全球卫星互联网星座部署进展及地面设备市场预测报告.docx
- 2026中国排版软件移动端发展趋势与市场机会分析.docx
- 2026耳鼻喉专科医工结合创新平台建设与成果转化路径.docx
- 2026南非矿业行业产业链现状与发展机遇分析研究报告.docx
- 2026中国脑机接口技术临床应用伦理审查与市场化前景研究报告.docx
原创力文档

文档评论(0)