- 6
- 0
- 约3.58万字
- 约 47页
- 2019-06-05 发布于江苏
- 举报
摘 要
随着计算机技术的发展,数据的信息量正在以指数形式增长。要想从海量、复杂的 信息中提取出有价值、有意义的数据就离不开数据挖掘和机器学习。绝大多数的数据挖 掘方法只能处理离散属性的数据,而现实中需要处理的数据中包含了许多连续属性,对 于连续属性的离散化研究就显得意义重大。大数据时代的到来,更加催化了连续属性离 散化算法的研究。离散化算法发展至今已经有了很多优秀的算法,从不同的侧重点、不 同的技术支持、不同的处理对象等可以将其划分为不同的种类。现在还没有一种离散化 算法,可以在不同的领域、不同的数据集中都能得到理想的结果。为了实现对不同的数 据集都能找到合适的离散化算法,本文的主要工作就是搭建离散化算法统一框架与软件 平台,主要的研究成果和内容如下:
首先,因为不存在通用的离散化算法,所以要实现更多的离散化算法,多实现才能 够多选择。本文对每一个离散化算法按照离散化的处理流程,把算法分解为断点的求解、 断点重要度的求解、最终断点集(归并和拆分),分别实现在不同的接口中。通过不同接 口的选择组合,不仅可以实现原来的离散化算法,还可以组合出新的算法,通过对新组 合算法的实验结果分析,当处理同一数据集时存在新组合的离散化算法优于原来的算 法,验证了可行性。这也是本文的创新之处。
其次,现在已经开发出了很多对连续属性离散化处理的软件,工具中集合了不同类 别的离散化算法。这些软件工具只能
您可能关注的文档
- 矿渣助磨激发剂的分析-材料学专业论文.docx
- 邻乙酰氨基苯甲酸合成技术研究-化学工艺专业论文.docx
- 课程考试成绩分析系统设计与应用的分析-教育技术专业论文.docx
- 论公言论宪法保护-法学专业论文.docx
- 矿用井下人员定位管理系统的设计与实现-软件工程专业论文.docx
- 矿山测量信息系统的研究与设计-大地测量学与测量工程专业论文.docx
- 论司法形式主义视阈下法律解释-法律专业论文.docx
- 矿井提升自动化装备故障预诊断系统研究-机械设计及理论专业论文.docx
- 论许鞍华的电影创作-电影学专业论文.docx
- 跨组织工作流中可信服务资源规划研究-软件工程专业论文.docx
- 【东方财富-2026研报】建筑建材行业半年度投资策略:布局科技转型、出海、内需托底修复三个方向,寻找超额收益.pdf
- 【SEC-2026行业研究报告】Form 10-Q Zumiez Inc .pdf
- 【金融街-2026研报】ETF市场流动性动态报告:宽基ETF资金持续净流出,科创债ETF资金净流入.pdf
- 【SEC-2026行业研究报告】Form 10-Q ARGAN INC .pdf
- 【港交所-2026研报】巨京控股 二零二五年/二零二六年中期报告.pdf
- 【SEC-2026行业研究报告】Form 10-Q America Great Health .pdf
- 【莱坊-2026研究报告】Brisbane CBD Office Market May 2026.pdf
- 【莱坊-2026研究报告】Leading Indicators June 2026.pdf
- 【SEC-2026行业研究报告】Form 10-Q DICK'S SPORTING GOODS, INC. .pdf
- 【SEC-2026行业研究报告】Form 10-Q lululemon athletica inc. .pdf
最近下载
- 2021年春部编版五年级语文下册第三单元汉字真有趣教案表格式+教学设计+学案.doc VIP
- 北京市101中学新初一分班考试英语真题及答案.pdf VIP
- IPC-4552B-2021 EN印制板化学镀镍 浸金(ENIG)镀覆性能规范 英文版.pdf VIP
- 商场整体风平衡计算书.xlsx VIP
- GJB 5712A-2023《装备试验质量监督要求》.pdf VIP
- 玻璃钢复合材料行业年度研究报告.pptx VIP
- Entech4700中文说明书资料.pdf
- 化工环境保护与及安全技术概论考试题及答案.docx VIP
- 农田水利工程灌渠设计.doc VIP
- 第5课 美丽河山我们的家 课件 人民版中华民族大家庭.ppt
原创力文档

文档评论(0)