- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
论文开题题目
哈尔滨师范大学
学士学位论文
开题报告
论文题目基于Web日志挖掘的个性化服务研究与应用
学生姓名 尹显赫
指导教师 廖祎玮
年级 2011级
专业 计算机科学与技术
2013年3月1日 课题来源:计算机技术和网络技术的发展与普及,为人们自由获取全球范围内的信息提供了条件,但同时也导致网上信息的爆炸式增长。伴随着信息媒体层出不穷以及当前用户需求的日益复杂,单单依靠传统浏览模式己经无法满足人们的需求,传统网页浏览缺乏个性化的局限性日益突出,个性化服务的研究及其实现成为必然。作为个性化信息服务的基础和核心,用户模型的质量直接关系到个性化信息服务的质量。个性化信息服务系统中的用户模型不是对用户个体的一般性描述,而是一种面向算法的,具有特定数据结构的形式化的用户描述。 课题研究的目的和意义:
研究的目的:Intemet为人们提供丰富信息资源的同时,也向人们提出了如何快速准确地从中获取所需信息的挑战。然而,研角b用户的需求是千差万别的,针对用户个人特征为用户提供准确恰当信息的个性化服务是目前研究的一个热点课题。在个性化服务中,用户模型是机器可理解的用户需求表示形式,它能否准确地反映用户的真实需求将直接显示存取系统的性能。本文将通过对用户信息需求的个性化分析,系统探讨如何获取、表达、构建基于web日志挖掘的用户模型,并实现用户模型,使未来的网络信息个性化服务变得更易用、更亲切,更加个性化,更能广泛地融进人们的社会生活。个性化服务实质上就是根据不同用户的兴趣提供相应的内容;如:有的用户关心的是整个证券市场的大盘走势,则应提供给他每日收盘行情、大盘走势等内容。而对那些关心具体股票行情的用户来说,提供给他们的就是相关的具体股票的情况。实现“个性化”信息服务的前提条件,就是必须要了解用户的兴趣,能自动判断哪些信息是哪些用户感兴趣的,哪些是用户不感兴趣的。通过对用户信息需求、兴趣爱好和访问历史的收集、统计、分析,建立一个反映用户基本兴趣和信息需求的用户模型,是实现个性化信息服务的基础。因此,在个性化服务中,首先必须挖掘用户的兴趣信息,建立合理的模型来描述、管理用户的兴趣,并通过不断更新与维护,逐渐优化模型,以精确反映用户的兴趣需求,为后续的个性化服务提供基础。这对于我国个性化服务的开发与实践也具有十分重要的理论价值和应用前景。
研究的意义:目前,国外关于该问题的研究相对于我国比较超前,且较广泛和深入,用户建模技术相对比较成熟。国内研究虽然起步晚一些,但最近几年发展也较快。由于用户建模技术的研究还处于起步状态,没有形成完整的技术体系,还有许多关键技术尚待解决,因此本文选题及其研究具有领先意义。通过分析研究个性化服务的历史、现状及发展趋势,决定在前人已取得工作成果的基础上,在基于研触b挖掘的个性化技术方面,对有关用户W七b使用数据的采集和预处理,个性化的用户兴趣模型的挖掘发现进行相应研究。个性化服务正在成为今后网络服务发展的重要方向,而用户模型是建立一个好的个性化服务的必要条件,好的用户模型可以为用户提供好的个性化服务使得用户不再面对大量的无用资源而无所适从,此外,有极高的商业价值。将个性化技术与基于叭触b使用挖掘技术相结合,研究基于认几b日志挖掘的个性化技术正成为当前个性化服务研究领域里一个新的研究课题。 国内外同类课题研究现状:
国内外同类课题研究现状:还有一些个性化服务系统如:Anatagonomy、Dyn耐cProfiler、FAB和研陌bsIFT等,它们同时采用了基于内容的过滤和协同过滤这两种技术,又称为基于内容和协同过滤的混合系统(Hybridsystem)。由于基于过滤技术的个性化推荐系统仍然存在一些问题,主要是大多数个性化推荐系统针对的是注册用户,较少考虑非注册用户的推荐。此外,大多数个性化推荐系统对新用户和访问站点较少的用户的信息推荐考虑不够,因为新用户和浏览站点较少的用户被系统收集的用户信息较少,采用某些推荐算法并不合适。针对这些存在问题基于数据挖掘的个性化推荐服务成为当前的一个研究热点,己经出现了许多基于W七b挖掘的原型系统和实际应用系统。例如美国MIImesota大学和DePaul大学开发的研陌bSIFT系统致力于使用挖掘算法定义及工具的研制,该系统通过对各种日志文件的数据预处理,应用序列模式分析、网页及用户聚类分析以及关联规则挖掘等方法实现用户模式发现,并应用信息过滤、OLA卫及可视化等技术实现了一个集M陌b内容挖掘和叭陌b使用挖掘结果于一体的个性化推荐系统。德国Hulnboldi大学研制的WUM则是一个集日志数据准备、查询和可视化技术于一体的集成环境,特别是它的挖掘查询语言LVBNT支持模式描述的标准规范,能够进行用户访问行为的序列模式发现,并用可视化
文档评论(0)