- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Classified Index: C931.9 U.D.C: 681.3.06
Dissertation for the Doctoral Degree in Management
RESEARCH ON TOPIC BASED
E-COMMERCE RECOMMENDATION
Candidate: Pang Xiu-li
Supervisor: Prof. Feng Yu-qiang
Academic Degree Applied for: Doctor of Management
Affiliation: Management Science Engineering
Date of Defence: September, 2008
Degree-Conferring-Institution: Harbin Institute of Technology
摘
摘 要
-
- I -
摘 要
随着互联网的普及和电子商务的发展,电子商务系统在为用户提供越来 越多选择的同时,其结构也变得更加复杂,用户经常会迷失在大量的商品信 息空间中,无法顺利找到自己需要的产品。电子商务推荐系统直接与用户交 互,模拟商店销售人员向用户提供商品推荐,帮助用户找到所需商品,从而 顺利完成购买过程。在日趋激烈的竞争环境下,电子商务推荐系统能有效保 留客户、防止用户流失,提高电子商务系统的销售。
然而随着电子商务系统规模的进一步扩大,电子商务推荐也面临一系列 挑战,由于用户兴趣主题分类中的特征较多,因此在商品语料中,往往存在 一些特征仅在某一些用户主题类别中出现,而在其它的用户主题中并不出现, 即数据稀疏问题,影响了推荐系统的精度;推荐方法的冷开始问题,即如果 一个新项目没有人去评价它,或都不去评价它,则这个项目得不到推荐,推 荐系统就失去了作用;只注重外延的推荐方法的优化,较少考虑产品自身的 语义信息等等。对此本文以用户感兴趣的信息主题来刻画用户的兴趣特征, 对电子商务推荐系统中主题分类技术、概念相关聚类方法、语义信息处理方 法以及推荐系统体系结构等关键技术进行了深入研究和探索,以提高电子商 务推荐方法的性能。本文研究的主要内容包括:
第一,基于主题的推荐系统需要分析资源内容信息,通过比较资源是否 跟用户用户档案一致决定是否进行推荐,它需要从资源中进行特征提取。由 于用户兴趣主题分类中的特征较多,因此在商品语料中,往往存在一些特征 仅在某一些用户主题类别中出现,而在其它的用户主题中并不出现,进而引 发了数据稀疏问题,严重影响了推荐精度。对此,引入统计语言模型 中 Good-Turing算法直接对特征词的条件概率平滑,采用“折扣再分配”策略对 统计参数进行重新估值,计算缺失特征词的补偿概率。此外,又将贝叶斯主 题推荐中的类别与特征词看作是Bigram语言模型中的二元对,并引入绝对折 扣(Absolute Discount)平滑算法针对二元对进行平滑,来克服数据稀疏问题带 来的影响。
第二,由于表达方式的多样性,即使同一商品概念如商品名称及属性名 称也可能有不同的表达形式,不同概念也可能存在部分-整体、值-属性等多 种相关关系。而相关研究中一般采用基于外延的推荐方法,仅利用商品的外
哈尔滨工业大学管理学博士学位论文
哈尔滨工业大学管理学博士学位论文
-
- II -
在特征等统计信息,使得推荐质量受到影响。对此,以知网作为商品概念相 关知识源,扩展推荐中的概念空间,利用词概念相关计算模型来计算用户的 兴趣主题,并与统计信息进行有效融合,以提升商品推荐对概念的敏感能力。 本文以融入自组织映射网络为例,对融合概念相关知识的方法作以深入探讨。
第三,在第二部分提出融合概念知识的基础之上,进一步对推荐对象的 语义信息构造方法进行研究,构建推荐概念知识库。对领域术语候选计算及 领域术语抽取,商品同义词词典的构造方法以及相关词构造方法进行研究。 领域术语抽取用于获取推荐系统原来未知的语义单元,新的专业术语等。当 新的商品、新的词汇出现时,推荐系统应该具备识别这些新术语的能力,此 外本文探讨基于词矢量空间计算相似度的方法以及基于平均互信息计算相关 词,这些不仅可用于概念相关知识推荐中,还可用于用户查询意图扩展中。
第四,不同的用户对同样的问题的理解不尽相同,理解的粒度也可能不 同。本文由此对用户个人偏好的异质性问题研究,提出基于协同的扩展偏聚 类方法,挖掘隐藏在主题内部的用户偏好。提出基于协同的扩展偏聚类方法, 将用户模型与用户对自身信息需求(兴趣爱好、信息访问方式及思维方式)的 组织形式相关联,以用户个性化的主题分类体系、主题分类标识为框架,采 用协同过滤方法扩展同类偏好数量,同时其用户端的层次化信息组织管理, 来克服以权重方式刻画用户兴趣的模型可能导致的偏
您可能关注的文档
- 基于主动队列管理算法的网络拥塞控制研究-计算机应用技术专业论文.docx
- 基于主客体作用的离子液体功能凝胶的制备-化学工程与技术专业论文.docx
- 基于主客观五种方法用于轻中度白内障的分级比较研究-眼科学专业论文.docx
- 基于主客体反应的微囊藻毒素纯化与检测方法的研究-水生生物学专业论文.docx
- 基于主客观相似性度量的协同过滤算法研究-计算机软件与理论专业论文.docx
- 基于主干网信息、可扩展的混合组播协议的研究-计算机软件与理论专业论文.docx
- 基于主成分分析-BP神经网络的港口竞争力评价研究-物流工程专业论文.docx
- 基于主成分分析和人工神经网络的酒类辨识-检测技术与自动化装置专业论文.docx
- 基于主导主体教学模式信息技术与高中地理课程整合的研究——以自然灾害的概念与特点部分为例-信息技术与课程整合专业论文.docx
- 基于主成分分析和支持向量机的太赫兹光谱鉴别模型-光学工程专业论文.docx
- 基于主题策略的网络爬行器算法研究-计算机系统结构专业论文.docx
- 基于主题的聚类检索技术研究计算机科学与技术专业论文.docx
- 基于众包模式的城市级路面危害坑洞检测技术-计算机科学与技术专业论文.docx
- 基于主颜色谱及空间分布熵的目标匹配技术研究-信号与信息处理专业论文.docx
- 基于主题的微博社会网络关注机制研究-计算机技术专业论文.docx
- 基于众包的企业竞争情报运行机制研究-情报学专业论文.docx
- 基于众包的室内定位关键技术研究-信息与通信工程专业论文.docx
- 基于众源地理数据的上海市旅游目的地关注度研究-地图学与地理信息系统专业论文.docx
- 基于住宅价格的居住密度优化研究-管理科学与工程专业论文.docx
- 基于住房保障公司的廉租房制度改进研究-管理科学与工程专业论文.docx
原创力文档


文档评论(0)