商务数据挖掘中基于遗传算法的关联规则分析-analysis of association rules based on genetic algorithm in business data mining.docxVIP
- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
商务数据挖掘中基于遗传算法的关联规则分析-analysis of association rules based on genetic algorithm in business data mining
第一章绪论§1-1论文的研究背景及其意义随着计算机技术的发展和普及,各个行业都开始采用计算机及相应的信息技术进行管理,企业生成、收集、存储及处理数据的能力大大提高,数据量与日俱增。在商业、电信、互联网、科学研究等方面,大量丰富的数据使得采用传统的数据分析手段很难从中得到知识,因而陷入了“数据丰富,知识缺乏”的困境[4][5]。数据挖掘技术应运而生。数据挖掘是把数据库技术、机器学习、统计学等好几个领域结合起来的一种技术。它可以挖掘出人们表面察觉不到的模式,这种模式是隐藏在数据内部比较容易被理解的而且是新颖的[3]。数据挖掘能推测出将来的情况,应用到商业领域中,能指导企业的商业决策。数据挖掘的出现避免了好多的麻烦,以前的商业活动中存在的问题需要花费好多的时间去解决。它能搜索整个数据库,找到外表看不到的模式,及时迅速的解决商业活动中的问题。电子商务系统的大量涌现为商务数据的挖掘与利用提供了条件,电子商务是数据挖掘最理想的应用领域之一。一方面在于它的理想性,另一方面在于它的实用性。数据挖掘是商务智能的技术基础,商务智能将各种数据及时地转换成企业管理者感兴趣的信息,并以各种方式展现出来,帮助企业管理者进行科学决策,加强企业的竞争优势。遗传算法是基于生物进化的概念设计了一系列过程来达到优化的目的[6]。这些过程包括:基因组合、交叉、变异、自然选择。遗传算法从一组初始可行解出发在不需要除目标函数外的其它信息的条件下实现对可行域的全局高效搜索并收敛到全局最优解,这种良好的特性使遗传算法成为组合优化和函数优化的有利工具,并成为计算智能领域的研究热点。关联联规则挖掘是数据挖掘中成果颇丰而且比较活跃的研究分支,关联规则挖掘是发现大量数据库中项集之间的关联关系。随着大量数据的增加和存储,人们对于从数据库中挖掘关联规则越来越感兴趣。从大量事务中发现有趣的关联关系,可以帮助许多决策的制定。目前,关联规则挖掘己经成为数据挖掘领域中的重要研究方向。本文讨论了应用遗传算法进行数据挖掘的思想和关键问题,提出了一种基于遗传算法的关联规则挖掘模型,并结合具体的实例给出了基于遗传算法的关联规则的提取算法。试验表明本文给出的算法是可行的和有效的,适合于关联规则挖掘这一重要而广泛的应用领域。基于遗传算法的关联规则挖掘技术还可以应用在销售分析、金融信贷风险分析、物流货源分析、交通事故分析等其他领域,具有很高的研究和应用价值。并且通过对国外数据挖掘工具应用和分析的研究,为今后在这一方面的发展及进一步开发出自己的数据挖掘工具打下良好的理论基础。§1-2数据挖掘的国内外现状1)国内现状目前,数据挖掘正是研究的热点,学者将会把主要的精力放在对海量数据进行挖掘的数据挖掘语言上。并且这种语言也会渐渐的形成它本身的标准。在数据挖掘过程中,研究并实现它的可视化,可以让众多的人能容易的弄懂它。在这个同时,也使得这个过程中能更好的进行人机相互。在互联网上建立数据挖掘服务器,它需要和数据库服务器相互配合,在网络这个环境中实现数据挖掘。这也是数据挖掘中要研究的。关联规则包含经典的apriori算法以及在此基础上对此算法方面的改进和扩展等。在算法这方面的研究可以说取得了一定的成绩。并且已经被用在了一些系统中。就拿我们大家都知道的IBM的Quest项目,集成了关联规则的挖掘算法。现在有好多大学和研究机构都对数据挖掘相关的技术进行了研究。模糊的方法应用在知识发现中这个方面北京系统工程研究所对它进行了研究。关联规则算法的优化和改进这个方面中国科技大学等单位对其进行了研究。而上海交通大学等对一些非结构化的数据挖掘以及web挖掘进行了研究[18][19]。2)国外现状数据挖掘作为一门新兴的研究领域,涉及到诸如机器学习、模式识别、统计学、数据库、人工智能、数学和可视化技术等等众多学科,是一个多学科相互交叉融合所形成的一个新兴的具有广泛应用前景的研究领域[7][8]。数据挖掘在科学研究、市场营销、金融投资、风险评估、欺诈识别、语音合成等领域应用比较广泛。在天气预报中被广泛应用的数据可视化软件TRITON,能观察现在的天气情况,分析过去的天气现象,根据所现在的模拟数据来对将来的天气情况进行预测。它是由德国科学院计算机图形学研究所和德国的气象局共同合作完成的。墨西哥为了研究地震发生的规律性,曾经对一些地方发生过五级以上的地震的数据进行了收集。并通过地理信息系统软件显示出众多个地震发生的位置,还可以查询地震发生的时间以及它的强度。通过查询过去相关地震的信息来指导工作人员预测发生地震的地方和大概的时间。这样可以及时提前通知人民群众,提早的采取一些预防措施。同时为了保证国家公共设施的安全而采用一些方法。争取把地震给大家造成的危害降低到最低。§1-3文章的结构文中总共有六个章节,大概内容如下:第一章是绪论,介绍了课题的研究背
您可能关注的文档
- 山东省三大流域水资源紧缺程度分析-analysis of water resources shortage in three major watersheds in shandong province.docx
- 山东省市级体育运动学校“体教结合”的发展研究——以济南市体育运动学校为例-research on the development of.docx
- 山东省水上竞技项目发展现状及对策分析-analysis on current situation and countermeasures of water sports in shandong province.docx
- 山东省体育学科建设现状及其发展模式分析-analysis of current situation and development mode of sports discipline construction in shandong province.docx
- 山东省体育旅游产业的swot分析与可持续发展对策分析-swot analysis and sustainable development strategy analysis of shandong sports tourism industry.docx
- 山东省蔬菜绿色供应链的构建及评价分析-construction and evaluation of green supply chain for vegetables in shandong province.docx
- 山东省生态红线划分及生态空间管控分析-analysis of ecological red line division and ecological space control in shandong province.docx
- 山东省土地利用变化及景观格局对沿河绿化范围响应-response of land use change and landscape pattern in shandong province to greening area along rivers.docx
- 山东省鲜活农产品物流发展分析-analysis on the development of fresh agricultural products logistics in shandong province.docx
- 山东省文化产业博览会项目评估分析-evaluation and analysis of shandong cultural industry exposition project.docx
原创力文档


文档评论(0)