- 11
- 0
- 约5.18万字
- 约 51页
- 2019-03-30 发布于上海
- 举报
万方数据
万方数据
Dissertation for the Master Degree in Engineering
Research and Implementation of Data Mining Algorithms Based on Logistics Information System
Candidate: Yanna Wang
Supervisor: Prof. Cui Gang
Academic Degree Applied for: Master of Engineering
Speciality: Computer Science and Technology
Affiliation: School of Computer Science and Technology
Date of Defence: June, 2014
Degree-Conferring-Institution: Harbin Institute of Technology
摘要
摘要
摘 要
计算机技术和互联网技术的快速发展,使得社会信息化、商业智能化越来越 发展剧烈,经济全球化、一体化也越来越为现代物流业所追求,促使物流也需要 充分利用信息技术来提升市场竞争力和利润。从企业级的大量数据中搜寻有决策 支持作用的信息就需要用到相关技术,数据挖掘技术就变得非常的重要。
数据挖掘有很多种,而关联规则挖掘使用的最为广泛。使用关联规则挖掘技 术可以在 CRM(Customer Relationship Management)、ERP(Enterprise Resource Planning)等业务中应用,为企业提供更加合理、适用的管理方案,为运营提供优 化的资源分配方案,使资源利用最大化、成本消费最小化,提高服务质量和客户
满意度,增大企业的盈利。一般的关联规则挖掘算法,都默认所有的物品的价值 一样,进行挖掘时没有对每种物品所带来的利润价值进行考虑,而企业所关心的 是获利,所以这样的数据挖掘就没有真正从企业的兴趣度出发进行实施。另外由 于需要进行挖掘的数据量一般都是企业级,非常巨大,所以当系统内存不够时及 使用多次扫描数据库的算法时,就会进行大量的 I/O 操作,从而影响了运行时间 和效率。
本论文进行了深入研究,首先介绍了物流信息系统、数据挖掘技术相关知识 和概念,并参考在此范围内研究人员的成果,提出了一种基于划分技术的加权关 联规则挖掘算法WPARAlgorithm。通过将该算法加载到 SQL Server2008 中,
采用 SQL Server 2008 进行数据处理,对该数据集进行挖掘并改变不同的参数进 行挖掘,同时使用 SQL Server 提供的关联规则挖掘算法对该数据集在相同条件 下进行了挖掘,对两个算法的性能进行比较,验证了 WPARAlgorithm 的优越性。
WPARAlgorithm 将大数据库划分为可以放在内存中的小分块,每次都单独 对一块进行操作,即这些操作都在内存中进行,避免了大量的 I/O 操作,提高了 算法的速度。同时,对连接步骤进行了压缩和优化避免了模式匹配操作,以提高 性能。并采用了以利润为基础的加权方法。根据企业的需要,以加利润权值区别 对待不同的项集,这样使得产生的规则将更加迎合企业的兴趣,对企业更加有用。
关键字:数据挖掘;关联规则挖掘;物流信息系统;加权;WPARAlgorithm
I
Abstra
Abstract
Abstract
With the fast development of computer technology and internet technology, society informatization and business intelligence grow more and more fiercely. And economic globalization and integration now is the target of modern logistics industry, making logistics enterprises to make full use of information technology to improve their market competitiveness and profit. When mining potential information which may be decision supportive from enterprise-level huge data, related techniques is necessary, and data mining technology becomes
您可能关注的文档
- 基于网络安全的政府监管分析-行政管理专业论文.docx
- 基于塑性和弹性模型的日元美元汇率波动实证研究-金融学专业论文.docx
- 基于数据挖掘的体育成绩管理与体能分析系统-软件工程专业论文.docx
- 基于前景理论的随机模糊多属性决策方法的研究-管理科学与工程专业论文.docx
- 基于生活情境的中学物理教学对学生能力培养的研究-课程与教学论(物理)专业论文.docx
- 基于利益相关者的企业社会责任与企业价值关系研究-会计学专业论文.docx
- 基于决策树的港口后方堆场辅助决策应用的研究计算机技术专业论文.docx
- 基于碳排放的 产品质量设计与推广策略研究-企业管理专业论文.docx
- 基于随机波动率和随机利率的亚式期权定价-应用数学专业论文.docx
- 基于数据挖掘的高校成绩分析系统的设计与实现-计算机技术专业论文.docx
最近下载
- 年产420吨锆废料回收项目可行性研究报告.docx
- 2025年加州驾照常考题库及答案.doc VIP
- 《现代汉语(下册语法部分)》PPT课件.ppt VIP
- 无人机测绘技术(微课版)03无人机测绘数据采集.pptx VIP
- 2025年房地产经纪人继承房产涉及的贷款问题处理专题试卷及解析.pdf VIP
- 2026年高考第一次模拟考试:地理一模突破卷02(新高考全国通用)(考试版).docx VIP
- 2025年互联网营销师绿色营销风险识别与管理专题试卷及解析.pdf VIP
- 2025年项目管理专业国际成本补偿合同汇率风险管理专题试卷及解析.pdf VIP
- 2025年拍卖师着装中的色彩搭配技巧与禁忌专题试卷及解析.pdf VIP
- 2025年无人机驾驶员执照敏感区域(如核设施)空域管控专题试卷及解析.pdf VIP
原创力文档

文档评论(0)