中南大学_电子商务_实验4..docVIP

下载本文档

25
0
约 26页
2016-12-24 发布于重庆
举报
版权申诉

中南大学_电子商务_实验4..doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

《电子商务应用》实验报告项目名称睿健时代专业班级 1206 学号 3901120604 姓名金初阳实验成绩：批阅教师：年月日实验4《电子商务数据挖掘实验》实验学时： 2 每组人数： 1 实验类型： 2 （1：基础性 2：综合性 3：设计性 4：研究性）实验要求： 1 （1：必修 2：选修 3：其它）实验类别： 3 （1：基础 2：专业基础 3：专业 4：其它）一、实验目的 1. 加深对数据挖掘概念和主要任务的理解。 2. 研究并学习几种常用的关联分析算法、分类算法、聚类算法和异常检测方法，了解它们的实现原理以及在电子商务中的应用。 3. 研究并学习几种常用的个性化商品或信息推荐方法，并结合选题设计一个简单的商品或信息推荐模型。二、实验内容 1. 研究并学习两种常用的关联分析算法的实现原理并编程实现其中一种，编程语言不限。 2. 研究并学习两种常用的分类算法的实现原理并编程实现其中一种，编程语言不限。 3. 研究并学习两种常用的聚类算法的实现原理并编程实现其中一种，编程语言不限。 4. 研究并学习两种常用的异常检测方法的实现原理。 5. 研究并学习两种常用的个性化商品或信息推荐方法，了解其实现原理和特点。 6. 结合选题，设计一个简单的商品或信息推荐模型。【注意：模型不一定要很复杂，关键是要能够说明其合理性，鼓励大家创新。以下两种商品推荐模型（信息推荐模型思路相似）基本思想供参考，也可在此基础上进行改进：① 分析用户的购买记录，找出他经常购买的商品的类型，然后在该类型中找出购买量或者访问量最大但是该买家之前并未购买的商品，并将这些商品推荐给该用户。② 找出与该用户具有相似购物习惯的其他用户，例如他们曾经购买过一些相同的商品，然后将其他用户购买过但是该用户未曾购买的商品推荐给他。】三、实验要求 1. 研究两种常用的关联分析算法，填写相应的表格，表格必须填写完整，任选一种编程语言实现其中的一种算法，要求提供详细源代码； 2. 研究两种常用的分类算法，填写相应的表格，表格必须填写完整，任选一种编程语言实现其中的一种算法，要求提供详细源代码； 3. 研究两种常用的聚类算法，填写相应的表格，表格必须填写完整，任选一种编程语言实现其中的一种算法，要求提供详细源代码； 4. 研究两种常用的异常检测方法，填写相应的表格，表格必须填写完整； 5. 研究两种常用的个性化商品或信息推荐方法，填写相应的表格，表格必须填写完整； 6. 结合选题，设计一个简单的商品或信息推荐模型，要求详细说明其实现过程，包括公式、流程等，但无需编程实现。四、实验步骤 1. 通过使用搜索引擎并查阅相关资料，研究并整理两种常用的关联分析算法，填写相应的表格并选择一种编程实现； 2. 通过使用搜索引擎并查阅相关资料，研究并整理两种常用的分类算法，填写相应的表格并选择一种编程实现； 3. 通过使用搜索引擎并查阅相关资料，研究并整理两种常用的聚类算法，填写相应的表格并选择一种编程实现； 4. 通过使用搜索引擎并查阅相关资料，研究并整理两种常用的异常检测方法，填写相应的表格； 5. 通过使用搜索引擎并查阅相关资料，研究并整理两种常用的电子商务个性化商品或信息推荐方法，填写相应的表格； 6. 结合选题，设计一个简单的商品或信息推荐模型。五、实验结果 1. 研究并整理两种常用的关联分析算法，编程实现其中一种，填写如下表格：关联分析算法名称实现原理 Apriori算法算法使用频繁项集性质的先验知识。Apriori使用一种称作逐层搜索的迭代方法，k项集用于探索（k+1）项集。首先，通过扫描数据库，累积每个项的计数，并收集满足最小支持度的项，找出频繁1项集的集合。该集合记作L1.然后，L1用于找频繁2项集的集合L2，L2用于找L3，如此迭代，直到不能再找到频繁k项集。找每个Lk需要一次数据库全扫描。Apriori性质可用于压缩搜索空间，提高频繁项集逐层产生的效率。Apriori性质：频繁项集的所有非空子集也必是频繁的。Apriori算法主要包括连接步和剪枝步两步组成。在连接步和剪枝步中采用Apriori性质可以提高算法的效率。 FP．growth算法它采取了分治策略：首先，构造频繁模式树FP．树，根据事务数据库及设定的最小支持度阀值，将包含频繁项集的数据库压缩到FP．树上