- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
致谢
本论文的工作是在我的导师林友芳副教授的悉心指导下完成的,林老师严谨
的治学态度和科学的工作方法给了我极大的帮助和影响,他指导了我学习研究的
方向,也教给我以后工作的所该具备态度和方式。在此衷心感谢两年来林友芳老
师对我的关心和指导。
在实验室工作及撰写论文期间,万怀宇师兄,王天宇等同学对我论文研究工
作给予了热情帮助,在此向他们表达我的感激之情。
另外也感谢我的父母,他们辛勤地工作,支持我,使我能够在学校专心顺利
完成我的学业。
l绪论
1.1研究背景和目的
Web是为广大用户交换或共享信息而发展起来的一种Intemet应用,近年来得
到了飞速发展,其信息量呈几何级数增长,每天都有数以百万计的网页加入到Web
中。它已经成为了一个涉及教育、政府、电子商务、新闻、广告、消费信息、金
融管理和许多其它信息服务的、巨大的、分布广泛、全球性的信息服务中心。
Intemet的普及和发展为人们带来了巨大的社会效益,与此同时它也为信息科
学的研究带来了巨大的机遇和挑战。虽然网络可以迅速便捷的为人们带来大量信
息,但是,Web所具有的海量数据、复杂性、极强的动态性、用户的多样性等特
点给Web资源挖掘造成了相当的难度。在实际应用中,当需要从网络上获取信息
时,有用信息往往会被大量的无用信息所淹没,使用户处于无所适从的境地,搜
索特定主题的少量权威信息源成为用户普遍又迫切的需求。
解决这些问题的一个有效途径,就是将传统的数据挖掘技术和Web结合起来,
进行Web挖掘。Web挖掘是一项综合技术,涉及了统计学、人工知识、模式识别、
并行计算、机器学习、数据库等多个领域。一个较为一般的定义是:Web数据挖
掘就是从与万维网相关的资源与行为中抽取感兴趣的、潜在的有用模式和隐含信
息。
随着万维网规模上的迅速增长,其复杂性也大大的增加,以至于我们已经无
法掌握其全貌。然而,在一些较小的本地的领域里,Web表现的仍然是有序的、
结构化的,因为网页的超链接结构是建立在人们努力进行注释的基础上的。Web
网页的作者往往会在其网页中添加指向相关主题网页的链接。通过利用这些链接
信息,就可以针对某一主题对网页进行提取和分组。搜索引擎可以帮助人们尽快
地找到所需要的信息,但是目前多数搜索引擎是基于分类或关键词逻辑组配的检
索方式,用户的一个查询请求往往会检索出庞大的结果集,而用户所需要的信息
却只是其中一小部分,面对如此多的结果,用户仍然不知所措。因此,如何提供
一些有效的工具和方法,帮助人们高效地获取所需信息,搜索所需领域的权威网
页就成为了研究者们所面临的重大课题。
社会网络分析从20世纪50年代开始,经过50多年的发展,已经成为一门成
熟的社会学科。主要是分析人与人之间的组成的社会网络。
而Internet上各个网页,它们之间相互链接,盘根错节,组织成了一个类似于
人类社会的网络,结合社会网络分析方法和传统的数据挖掘方法,将对Web资源
的社会网络分析方法的挖掘进行研究,帮助人们高效的获取所需信息,寻找所需
领域的权威信息。
1.2研究现状
1.2.1W.eb挖掘现状
近年来,随着Internet/Web技术的快速普及和迅猛发展,使各种信息可以以
非常低的成本在网络上获得,由于Internet在全球互连互通,可以从中取得的数
据量难以计算,而且Internet的发展趋势继续看好,特别是电子商务的蓬勃发展
为网络应用提供了强大支持,如何在万维网这个全球最大的数据集合中发现有用
信息无疑将成为数据挖掘研究的热点。
Web挖掘指使用数据挖掘技术在万维网数据中发现潜在的、有用的模式或信
息。Web挖掘研究覆盖了多个研究领域,包括数据库技术、信息获取技术、统计学、
人工智能中的机器学习和神经网络等。
根据对Web数据的感兴趣程度不同,Web挖掘一般可以分为三类:Web内容
挖掘、Web结构挖掘、W曲用法挖掘,后面将会介绍。
1.2.1社会网络分析现状
Network
社会网络分析(Social Amalysis),顾名思义是分析社会网络的,1954
年第一次由英国的人类学家BROWN提出社会网络这个概念。经过50多年的发展,
它有两种不同的研究方向。
一种是整体网络分析,也是网络结构分析,主要研究群体中不同角色的关系
结构,引进数学的图论,使用社会关系图来
您可能关注的文档
- S电力设计院人力资源的规划.pdf
- TCRL企业人力资源的管理系统优化的研究.pdf
- TD-LTE系统的无线资源调度算法的研究.pdf
- TD-HSUPA无线资源分配策略的研究.pdf
- 安庆企事业单位体育资源利用问题的研究.pdf
- 北极生态安全法律制度的研究.pdf
- 产业转型升级与人力资源的开发——深圳市宝安区的案例的研究.pdf
- 常青公司人力资源的诊断报告.pdf
- 超宽带认知无线电关键技术的研究.pdf
- 赤峰市水资源可持续利用的研究.pdf
- 关于生命周期的中小企业人力资源的贡献计量的研究.pdf
- 关于土地资源约束下的区域PRED系统综合协调度的研究——以宜春市为例.pdf
- 关于网格的海洋信息互操作平台的研究及其应用.pdf
- 关于微信公众平台的学习资源平台设计与开发——以《计算机基础》为例.pdf
- 关于文化创意产业视角的旅游资源整合的研究——以温州为例.pdf
- 关于物元模型的鄱阳湖生态经济区土地资源生态安全评价的研究.pdf
- 关于物质流和生态足迹的资源环境可持续发展分析与评价——以石家庄市为例.pdf
- 关于现代信息技术的中学语文教学网络资源整合的研究.pdf
- 关于信息资源整合的YHTC公司会计信息系统的研究.pdf
- 关于遗传算法的认知无线网络资源分配技术的研究.pdf
最近下载
- 2025年卫生高级职称面审答辩(呼吸内科)在线题库及答案(副高面审).docx VIP
- 历年试题--高等代数历年试--高等代数历年试题--高等代数历年试题--高等代数.doc VIP
- 复件 文言文名词用做动词课件.ppt VIP
- 大学生职业生涯规划.pdf VIP
- 电子科技大学《计算机编译原理)》20春期末考试.docx VIP
- 2025年水利水电工程施工企业安管人员考试(项目负责人B类)综合练习题及答案.docx VIP
- T_CECA-G 0025—2019_分布式太阳能光伏发电系统运行管理维护通则.pdf
- 稀土磁性材料.ppt VIP
- Geneapper ID-X使用.ppt VIP
- 新15J709 防火门、窗及卷帘.docx VIP
原创力文档


文档评论(0)