基于物流信息系统的数据挖掘算法的研究与实现-计算机科学与技术专业论文.docxVIP

  • 11
  • 0
  • 约5.18万字
  • 约 51页
  • 2019-03-30 发布于上海
  • 举报

基于物流信息系统的数据挖掘算法的研究与实现-计算机科学与技术专业论文.docx

万方数据 万方数据 Dissertation for the Master Degree in Engineering Research and Implementation of Data Mining Algorithms Based on Logistics Information System Candidate: Yanna Wang Supervisor: Prof. Cui Gang Academic Degree Applied for: Master of Engineering Speciality: Computer Science and Technology Affiliation: School of Computer Science and Technology Date of Defence: June, 2014 Degree-Conferring-Institution: Harbin Institute of Technology 摘要 摘要 摘 要 计算机技术和互联网技术的快速发展,使得社会信息化、商业智能化越来越 发展剧烈,经济全球化、一体化也越来越为现代物流业所追求,促使物流也需要 充分利用信息技术来提升市场竞争力和利润。从企业级的大量数据中搜寻有决策 支持作用的信息就需要用到相关技术,数据挖掘技术就变得非常的重要。 数据挖掘有很多种,而关联规则挖掘使用的最为广泛。使用关联规则挖掘技 术可以在 CRM(Customer Relationship Management)、ERP(Enterprise Resource Planning)等业务中应用,为企业提供更加合理、适用的管理方案,为运营提供优 化的资源分配方案,使资源利用最大化、成本消费最小化,提高服务质量和客户 满意度,增大企业的盈利。一般的关联规则挖掘算法,都默认所有的物品的价值 一样,进行挖掘时没有对每种物品所带来的利润价值进行考虑,而企业所关心的 是获利,所以这样的数据挖掘就没有真正从企业的兴趣度出发进行实施。另外由 于需要进行挖掘的数据量一般都是企业级,非常巨大,所以当系统内存不够时及 使用多次扫描数据库的算法时,就会进行大量的 I/O 操作,从而影响了运行时间 和效率。 本论文进行了深入研究,首先介绍了物流信息系统、数据挖掘技术相关知识 和概念,并参考在此范围内研究人员的成果,提出了一种基于划分技术的加权关 联规则挖掘算法WPARAlgorithm。通过将该算法加载到 SQL Server2008 中, 采用 SQL Server 2008 进行数据处理,对该数据集进行挖掘并改变不同的参数进 行挖掘,同时使用 SQL Server 提供的关联规则挖掘算法对该数据集在相同条件 下进行了挖掘,对两个算法的性能进行比较,验证了 WPARAlgorithm 的优越性。 WPARAlgorithm 将大数据库划分为可以放在内存中的小分块,每次都单独 对一块进行操作,即这些操作都在内存中进行,避免了大量的 I/O 操作,提高了 算法的速度。同时,对连接步骤进行了压缩和优化避免了模式匹配操作,以提高 性能。并采用了以利润为基础的加权方法。根据企业的需要,以加利润权值区别 对待不同的项集,这样使得产生的规则将更加迎合企业的兴趣,对企业更加有用。 关键字:数据挖掘;关联规则挖掘;物流信息系统;加权;WPARAlgorithm I Abstra Abstract Abstract With the fast development of computer technology and internet technology, society informatization and business intelligence grow more and more fiercely. And economic globalization and integration now is the target of modern logistics industry, making logistics enterprises to make full use of information technology to improve their market competitiveness and profit. When mining potential information which may be decision supportive from enterprise-level huge data, related techniques is necessary, and data mining technology becomes

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档