(参考)数据挖掘技术的应用研究.docxVIP

  • 10
  • 0
  • 约1.9万字
  • 约 58页
  • 2018-06-08 发布于贵州
  • 举报
(参考)数据挖掘技术的应用研究

数据挖掘技术的应用研究黄解军 潘和平 万幼川(武汉大学遥感信息工程学院数字智能研究中心,武汉)计算机工程与应用!#$!#$! 保险业中的数据挖掘随着社会保障体系的日益健全,保险业取得了蓬勃的发展,发挥着越来越重要的作用。如何保持现有客户,争取潜在的客户,以及如何识别诈骗行为,是保险业中面临的主要问题。数据挖掘技术是解决这些问题的有效方式,对业务数据、客户数据等各种数据分析,有利于保险公司开展业绩评价、财务预算、市场分析、风险评估和风险预测等,大大地提高企业防范和抵抗经营风险的能力和水平,也为管理人员提供科学的决策依据。建立预测模型,对投保人的层次分类,发现索赔的投保人特征,统计索赔的次数和相关的信息,更有效地了解客户行为。同时,分析保险欺诈案件的特征和规律,有效地预防欺诈案件的发生,减少和控制了公司资金的非法流失。针对投保人的工作性质、年龄、健康状况和工资等记录,寻找影响索赔率的内在因素。#$#金融业中的数据挖掘由于金融业中的数据相对比较完整,质量较高,因此,数据挖掘在这一领域中的应用相对较为成熟,也取得较好的社会效益和经济效益。通过分析市场波动的因素,建立预测模型,进行投资分析和预测,改进预测市场波动的能力,为投资决策提供科学的依据。在分析客户的工资收入、教育水平、居住区域和信用历史等的基础上,找到影响信贷的重要因素,进而调整贷款发放政策。如%’公司开发了应用在金融业中的数据挖掘产品,美国第一银行、(’’国家银行、)*++ (,-./银行和化学银行等都采用了数据挖掘技术。通过信用欺诈的建模和预测、风险评估、收益分析,帮助银行发现具有潜在欺诈性的事件,开展欺诈侦查和其他金融犯罪行为分析,预防资金非法流失。网站动态数据挖掘,有助于识别有价值的客户,开展跨区销售,强化客户关系管理01234。孤立点挖掘可以发现异常模式,侦查不寻常的信用卡使用,确定极端客户的消费行为。在证券交易中,帮助股票预测、证券市场分析等,可以发现“利润超重”和“账务造假”等现象,避免遭受重大的经济损失。#$5 医疗保健中的数据挖掘医学和生物工艺学中的基因分析中,需要处理大量的基因数据,通过数据挖掘技术有助于对这些数据的研究和理解064。医学领域中对疑难病症的攻关和研究,结合数据挖掘技术,建立各种医疗数据模型,找出数据本质上的联系和现象,推动医学研究的进展。对医学历史数据的收集和分析后,可以找到疾病产生的原因,优化药物的搭配,提供最佳的治疗方案。融入专家知识和人工智能技术等,集成医学诊断专家系统,进行医疗自动诊断,药物的疗效分析和新药物的合成。研究人口的地区分布、年龄构成和身体状况等特征,有利于开展药品销售、医疗设施配备和医院布局等活动。如美国789公司在医药方面引入了数据挖掘技术0:4,包括医药处方定位和分割,评价药品销售效果以及建立行为预测模型;牛津移植中心也采用基于决策树方法的;/=+*.* 9**?*-辅助他们的研究工作。#$@ 制造业中的数据挖掘在制造业中,数据挖掘广泛地应用于控制产品生产流程和技术规划方面。分析产品各种指标参数的关系,优化原料的搭配,开发新的产品类型。根据市场信息数据库中居民密度分布、收入状况和相应的城市规划等信息,企业可以展开产品需求量的调查。例如汽车制造商挖掘信息库中人口分布、区域购买力状况及公路交通状况等信息,依据分析结果,决定产品的销售渠道、总体和局部销售网点的规划等,对商业网进行部署,并及时调整产品的生产导向和生产结构,这对于企业和公司的经营状况和发展前景具有重要的影响。在产品的控制和检测方面,孤立点分析可以用于检验产品质量,识别偏差检测。了解相关产品的供需比例、消费者分布等信息,制定产品生产策略。美国的部分大型钢铁公司将数据挖掘技术应用在发现和探测潜在的质量问题,提高了产品的生产质量和效率。5数据挖掘在应用中的几个问题在数据挖掘技术的应用中,往往对数据挖掘缺少正确的认识,认为数据挖掘毫无用处,结果不可靠;或者认为数据挖掘是万能的,从数据中可以发现想要的任何知识和信息。这两种观点都是不正确的,应该避免走极端,客观地认识数据挖掘。数据挖掘的实施需要花费很长的时间和较高的费用,在一些公司或行业不一定会产生较好的经济效益,因此,盲目地运用数据挖掘,也可能给公司带来包袱和负担。在实际应用中,应该注意数据质量、算法选取、结果评价和保护客户的个人隐私等问题。5$: 数据质量的问题数据挖掘中涉及到大量的数据,不可避免地会出现一些错误的、冗余的数据,给数据挖掘带来一定的困难。例如,数据的缺值现象,则不能客观地反映数据的属性和特征;含噪声的数据会影响抽取模式的准确性;对于超大数据量,也给知识发现带来很大的麻烦。在对数据进行取样时,应该根据用户挖掘的主题,选择有效的数据集,并对数据进行清理、归并和转换等操作,保证数据的代表性和客观性。5$! 技

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档