- 1、本文档被系统程序自动判定探测到侵权嫌疑,本站暂时做下架处理。
- 2、如果您确认为侵权,可联系本站左侧在线QQ客服请求删除。我们会保证在24小时内做出处理,应急电话:400-050-0827。
- 3、此文档由网友上传,因疑似侵权的原因,本站不提供该文档下载,只提供部分内容试读。如果您是出版社/作者,看到后可认领文档,您也可以联系本站进行批量认领。
查看更多
Research on Heterogeneous
Information Network Analysis Model
and Application
A Thesis Submitted to Chongqing University
in Partial Fulfillment of the Requirement for the
Doctor’s Degree of Engineering
By
Li Peng
Supervised by Prof. Wen Junhao
Specialty: Computer Science and Technology
College of Computer Science of Chongqing University,
Chongqing, China
May 20 13
中文摘要
摘 要
随着信息数据类别的多样化和数据关系的复杂化,信息网络正在向异构化方
向发展。因此,如何借助网络分析的手段,从异构信息网络中挖掘出有用知识是
信息检索和知识挖掘面临的新课题。在异构信息网络中,参与知识挖掘的关键元
素主要包括数据、服务和人类活动。上述元素中,以关系型数据库为代表的数据
存储方式为海量信息提供了结构化的数据管理模式;以Web 服务为代表的功能提
供方式为构建公开化、松耦合的信息平台奠定了基础;以微博为代表的社交网络
活动形式提供了新型的数据共享和信息交互方式。随着数据类别的多样化、服务
访问的频繁化以及社交活动的网络化,人们对个性化的数据查询、聚类分析、活
动预测等需求与日俱增,因此,对异构信息网络分析模型及其在信息检索和知识
挖掘中的应用研究具有理论及现实工程意义。
针对异构信息网络发展趋势及面临的新课题,基于异构信息网络中异构对象
关系挖掘与异构信息网络描述模型,研究了异构信息网络中节点排序函数;基于
描述模型和排序函数,结合Web 服务异构网络、关系型数据库元组网络与社交网
络,研究了异构信息网络分析模型的新型聚类分析、排序以及活动预测方法。
论文研究的主要工作包括:
① 结合信息网络异构化发展趋势,基于对聚类、个性化查询与社交网络预测
等研究现状及存在问题的分析,借助形式化方法研究了异构信息网络的描述模型。
② 基于异构信息网络描述模型,提出了基于异构信息网络分析的排序方法。
根据不同网络连接形式和排序规则,该排序方法定义了4 种不同类型的排序函数。
不同排序函数的实例分析对比研究表明,该排序方法可为网络分析提供基础数据
排序方法支撑。
③ 鉴于以属性为计算依据的聚类不支持异构数据、忽略数据排序等问题,从
关系的维度出发,提出了基于异构信息网络分析的聚类算法。基于该聚类算法,
以Web 服务聚类为例,提出了基于异构服务网络分析的服务聚类算法SNTClus。
SNTClus 算法基于服务标签等各参与方对象及关系构建异构服务网络描述模型,
基于服务排序模型构建聚类多维度量模型,借助网络划分和排序循环迭代方法实
现Web 服务聚类。以 Titan 服务集为数据集的实验分析结果表明,SNTClus 算法
的服务聚类时间开销代价低、聚类准确度高。
④ 针对当前信息查询中个性化支持程度低等问题,提出了基于异构信息网络
分析的个性化查询方法。该方法研究以关系型数据库为例,针对当前关系型数据
库个性化top-k 查询要求,提出了基于异构元组网络分析的关系型数据库排序方法
I
重庆大学博士学位论文
RNRank 。RNRank 排序方法基于异构元组网络提取和异构元组网络关联分析构建
元组排序模型,按照是否考虑数据类别属性分别提出单类别数据元组排序算法
RNRank-I 和多类别条件下基于聚类分析的数据元组排序算法RNR
文档评论(0)