- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Web访问对象轨迹聚类方法分析-计算机软件与理论专业论文
Web
Web 访问对象轨迹聚类方法研究
哈尔
哈尔滨工程大学硕士学位论文
摘 要
自互联网诞生 20 多年以来,基于 Web 的信息系统、电子商务、Web 服务等领域得 到迅速发展和壮大,同时数据收集和数据存储技术的快速进步使得互联网上囤积了海量 的点击流数据和用户数据,从这数以万亿计的数据中提取有价值模式已成为巨大挑战。 阶段的研究分成三大主要方向:基于 Web 结构挖掘技术、基于 Web 内容挖掘技术和基 于 Web 使用挖掘技术,其中基于 Web 使用挖掘技术就是本文重点研究的内容。
本文主要以 Web 用户访问数据预处理过程、访问轨迹聚类使用技术以及在 Web 用 户访问个性化推荐等方向为主线着手开展研究,主要研究成果从以下几个方面阐述。
首先在深入研究了使用 Web 使用挖掘领域的相关理论和技术之后,给出了挖掘实 施过程整体框架,包括 Web 用户访问数据预处理工作、Web 访问轨迹聚类、应用个性 化推荐等核心模块。在预处理阶段详细阐述了预处理的数据格式化、访问数据元识别、 数据完整性、访问事务识别等个子过程的方法步骤,并附以文字图示详细阐述。用已经 公开的远程服务器日志作为数据集,实验验证了提出的方案的正确性并得到聚类粒度小 的用户访问记录,这对后期的工作打下坚实的基础。
其次针对 Web 使用数据量庞大、聚类过程的效率不高并占用大量系统资源、聚类 结果准确性的评估等问题,提出了用户兴趣特征的形式化表示方法和用户之间的相似度 计算方法。另外,在 KPC 聚类算法的基础上引入投票选举策略思想,加速改进算法的 收敛速度,提升聚类结果的精准度,并且验证实验显示出期望的结果并且具有很高的现 实指导意义。
最后一部分是依据前两方面的成果,针对互联网造成的信息泛滥、信息迷航问题, 提出一个基于改进聚类算法的用户访问个性化推荐模型,给出了其中详细的形式化定义 并列出判定当前用户隶属聚类中心的算法步骤。针对上述给出的方法进行了仿真实验验 证模型可行性。
关键字:Web 访问;数据预处理;轨迹聚类;投票选举策略;个性化推荐
Abstract
Since the birth of the Internet more than 20 years, Web-based information systems, E-commerce and Web Services have gotten the rapid development. At the same time, the Internet has hoarded vast amounts of the click-stream data and user data because of the hops
advances in data collection and data storage technology. That’s a huge challenge to extract
valuable patterns from tens of trillions Web data. The present study is divided into three main directions: the Web-based structure mining technology, contents mining technology and Web usage mining technology. And we focus on the last one.
To initiate the study, the main clue to the paper lies on the Web user access data preprocessing, access trajectory clustering technology and access personalized recommendation. The main research results are elaborated from the following aspects.
Firstly, after in-depth study to the theory and technology of the web usage mining, we designed the overall framework of the mining implementation process, including data preprocessing, trajectory clustering process, and personalized recommendation core module. During the fi
您可能关注的文档
- UU声触诊组织定量分析技术在慢性肾脏疾病诊断中的初步应用分析-临床医学(影像诊断专门化)专业论文.docx
- UV-LIGA制备金微小零件技术研究机械制造及其自动化专业论文.docx
- UV-固化聚氨酯丙烯酸酯纳米杂化涂料的合成、固化反应动力学与性能-高分子化学与物理专业论文.docx
- UVA对球型脂质膜模型内质粒DNA环状结构的破坏-生物医学工程专业论文.docx
- UVA照射对黑腹果蝇生物学特性和抗氧化反应的影响-农业昆虫与害虫防治专业论文.docx
- UVB对人上皮细胞损伤作用的实验研究-流行病与卫生统计学专业论文.docx
- UV光固化水性木器涂料的制备与性能研究-材料工程专业论文.docx
- UV光固化水性聚氨酯的合成及在静电植绒上的应用-纺织化学与染整工程专业论文.docx
- UV凹印磨砂油墨的研究-教育技术学专业论文.docx
- UV固化固相微萃取新型涂层的开发和应用-应用化学专业论文.docx
- Web视频资源的智能发现关键技术研究-计算机科学与技术专业论文.docx
- Web访问模式发现与应用研究软件工程专业论文.docx
- Web评论文本情感分类方法研究-计算机科学与技术专业论文.docx
- Web长期保存的困扰研究-图书情报专业论文.docx
- Web链接结构挖掘中HITS算支的分析与改进-计算机应用技术专业论文.docx
- Web记录自动抽取与去重方法的研究与实现-计算机软件与理论专业论文.docx
- Web页面分块技术的研究与实现-计算机技术专业论文.docx
- Web页面用户评论信息抽取技术研究-计算机应用技术专业论文.docx
- Web页面加载性能监测平台的设计与实现-通信与信息系统专业论文.docx
- WENGER箱包在中国市场的营销策略研究-工商管理专业论文.docx
文档评论(0)