- 13
- 0
- 约1.34万字
- 约 101页
- 2017-08-18 发布于贵州
- 举报
(C) Vipin Kumar, Parallel Issues in Data Mining, VECPAR 2002 (C) Vipin Kumar, Parallel Issues in Data Mining, VECPAR 2002 关联分析: 高级概念 关联分析处理事务数据 处理分类属性 处理分类属性 为了提取这样的模式,我们需要将标称属性和对称二元属性转换成“项”,使得已有的关联规则挖掘算法可以使用。 这种类型的变化可以通过为每个不同的属性-值对创建一个新的项来实现。 例如: 标称属性文化程度可以用三个二元项取代 文化程度=大学 文化程度=研究生 文化程度=高中 类似的,对称二元属性性别可以转换成一对二元项:性别=男、性别=女。 处理分类属性 将关联分析用于二元化后的数据时,需要考虑如下问题。 (1)有些属性值可能不够频繁,不能成为频繁模式的一部分。如:州名。 解决办法:将相关的属性值分组,形成少数类别。例如,每个州名都可以用对应的地理区域取代。例如:分别用中西部、太平洋西北部、西南部和东海岸取代。 处理分类属性 将关联分析用于二元化后的数据时,需要考虑如下问题。 (2)某些属性值的频率可能比其他属性高很多。如:假定85%的被调查人都有家庭计算机,如果为每个频繁出现在数据中的属性值创建一个二元项,我们可能产生许多冗余模式。 {家庭计算机=是,网上购物=是
您可能关注的文档
- 高频功率放大器实验.ppt
- 高性能混凝土的原材.ppt
- 上海高校网格及进展.ppt
- 中国的商业和旅游业高二下文科复习第四节).ppt
- 高三英语unit4green world.ppt
- 第四期全省高校党支书记培训班.ppt
- 高清网络化应用.ppt
- 网络高质量学术文献获取策略.ppt
- 中图版高中地理教材色分析.ppt
- 新课程理念下的高中学实验教学改革.ppt
- 2024-2025学年湖南省邵阳市新宁县回龙寺镇人教版一年级下册期中测试数学试卷.docx
- 2024-2025学年山东省德州市平原县王杲铺中小、王凤楼中小、腰站镇中小青岛版一年级下册3月月考数学试卷.docx
- 第四单元 课题3 物质组成的表示-初中化学新教材预习学案(人教版2024九年级上册).docx
- 2024-2025学年山东省济宁市梁山县人教版一年级下册期中测试数学试卷.docx
- 2024-2025学年山东省德州市德州经济技术开发区长河小学等校青岛版一年级下册期中考试数学试卷.docx
- 2026《基于国产开源单片机GD32VF103的输变电设备物联网传感器设计》8300字.docx
- 2024年中考道德与法治真题完全解读(北京卷).docx
- 2026《基于机器视觉识别的工件边缘曲线重构方法分析》9000字.docx
- 课时9.4 物体的浮与沉【一大题型】八年级全一册物理(沪科版2024).docx
- 2024-2025学年广东省江门市开平市人教版一年级下册期中综合素养评价数学试卷.docx
最近下载
- 新视野大学英语3读写教程(第三版)u3培训课件.pptx VIP
- 盘扣式脚手架巡视检查记录表.docx VIP
- 蜜蜂授粉技术操作规程 .pdf VIP
- 2023年福建南平中考英语真题及答案.pdf VIP
- SY∕T 6106-2020 气田开发方案编制技术要求.pdf
- 项目二 任务一 托盘(教案)《餐饮服务与管理》(高教版第二版)同步课堂.docx
- 2025年演出经纪人演员梯队建设与组合(团体)管理专题试卷及解析.pdf VIP
- 2025年房地产经纪人“层级分摊法”在复杂建筑中的应用专题试卷及解析.pdf VIP
- 基于联邦学习的医疗数据隐私保护方案.pdf VIP
- 2025年无人机驾驶员执照考古勘探中地形复杂与文物碰撞风险事故案例分析专题试卷及解析.pdf VIP
原创力文档

文档评论(0)