基于商空间的构造性数据挖掘方法及应用-计算机应用专业论文.docx

基于商空间的构造性数据挖掘方法及应用-计算机应用专业论文.docx

摘要/蕤瓣诗羹瓿模式谈粼技术靛磷究鬻裳震,辫蔽霉黎澄逡:菸不簸拓疑, 摘要 /蕤瓣诗羹瓿模式谈粼技术靛磷究鬻裳震,辫蔽霉黎澄逡:菸不簸拓疑, 一溪褒德诲雾实际耀爨,鳐鑫聚王嚣颈溅、蕤予海察戆多攥髂数攒薅捡索簿 簸域鹊浚澍分类成必霹黪。憨络滤粪褥惑,胃激发现它稻袭琥蠢斡共有特 饺:①属予海量数据的处理问题,问题的特征空间维数黼。提供的样本数 豢大甏蕊疆涉及蕊爽聚鼗霉多。◇牵涉鹣露素疆多,逮蒸零舞惩令不寰餐 髅息系统。③采集的数攒中存在滋难以蠛确赛嫩的噪啻僚怠。 势瓣逡粪超爨,≯舔文疑开了一系列黧研究搽讨,主蘩羹穆鬣括: i.务褥这癸簿藤求瓣魏一释霹移方案是:掰商空鬻法袋奢蘧继对簧 杂问题溅行粒度描述,分解复杂问题为可求觯的。提出慰分麟后的不同裁 度麓予阏遂,弓l入构浚毽橇器学溺方法首先获敬举箴粒度黪攀习艇刚,然 爨霉会成穰关戆藏瓣,矮憋褥鬟鬟杂淹隧熬综鸯疑期。 2.针对相同粒威巾虫踺鹰德劐学习娥煲lJ海题,提出?多溅磷遽逛髓!激 戆萋零撩絮,辩鬣霄稔怒球嚣覆菠蒙法遴器了辫豢戆致遽。攒密7覆羞穷 法鼹优之处在于凝蕊领域建全真实媳夏软了样夯躺分毒情糖,飨逡了在霓 方法串攥瑟遂一爹研究的兰个闻舔。第一个是对诚算法议别的正确率与滋 毽§量力志灏矛霪熬鲻决,鞭惩没菘羧任健覆盖壤域覆盖懿撵零辩燕骧爨 纛),等f入了多侧瑟递进的处聪嵛法MIDA(Multiside increasing by degrees algorithm)。蔡:个是鲻穗改进覆盖蠢浚,傻褥覆藏溪蠛冒戳识 副嗓音(姆冥动良爨),斑ll{:弓l入爹覆盖镁域瀵装瓣鸯耋个数必谖聚孛懿 权蓬。麓黧是捃旃减少掰褥嚣熬凌麓疆域蘸数麓,隽筵鬟入了燕篾覆盖骞 法RCA(R《}peat cover algorithm)_和去除覆盖领域过小的方法,遂有利半 撼寓穗络熟泛踅能戈。一个蓬缮锻究趣蠢寨是将覆莲夔嚣怒《璇蒸手覆釜 懿对数瓣瓣箍述努法)应瑟予特程港释静童分羹势糈,为鼹,弓|入点对静 概念,掇瞧了点慰杰分蠢分析方法DPCAA《Double-point PrinciDal Component Analysis Algorithm)。 3.猩商空间祺裂中,利用商犏扑形成的多数搌源,提出了~种新的 一t一 概率决策型数据挖掘规则算法DDMR。作者认为:对于高维海量数据的对 概率决策型数据挖掘规则算法DDMR。作者认为:对于高维海量数据的对 象,用多侧面递进方法进行划分、分解,使它由难变易;而对于多表描述 的复杂的数据库或数据仓库,则可认为是给定了多侧面的一个复杂对象, 因此,在商空间的模型下,两者可用相同的方法分析、处理、识别。 (股市的运行是一个非常复杂的不完备的非线性过程,因此,需要用对 不完备信息进行处理的非线性模型代替传统的统计模型,以便进~步提高 股市预测的质量。本文将构造性机器学习算法用于建立股市分析的商空间 模型,其中的主要工作有: 1.结合股市趋势预测这一实际问题,建立了股市分析的商空间模型, 将多侧面递进算法MIDA、概率决策型数据挖掘规则算法DDMR应用于时间 序列的预测问题。 2.对序列问题的预测,提出处理的方法应尊重数据本身规律,不人 为的采取另行预处理,以便能挖掘出对象的本质规律。对采集的股市数据, 直接按一定的时段、交易量组成序列,进行识别分类,实验测试结果令人 满意,因此,提出的方法具有普遍意义。、 关键词:商空间、构造性机器学习、多侧面递进算法、股票预测。 粉糊撅 AbstractWith Abstract With the development of computer’S pa拄em recognition technology,its applications have been extended ceaselessly,It is able to recognize these problems,such as financial engineering forecasting and multimedia database searching based on contents.Not only these problems have a feature space of high dimensionality and a data set with large amount ofsamples that belong to many different classes,but also the system involves many factors and is imperfect information systems,In addition,there is noise information that is difficulty to r

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档