(C) Vipin Kumar, Parallel Issues in Data Mining, VECPAR 2002 (C) Vipin Kumar, Parallel Issues in Data Mining, VECPAR 2002 关联分析: 高级概念 关联分析处理事务数据 处理分类属性 处理分类属性 为了提取这样的模式,我们需要将标称属性和对称二元属性转换成“项”,使得已有的关联规则挖掘算法可以使用。 这种类型的变化可以通过为每个不同的属性-值对创建一个新的项来实现。 例如: 标称属性文化程度可以用三个二元项取代 文化程度=大学 文化程度=研究生 文化程度=高中 类似的,对称二元属性性别可以转换成一对二元项:性别=男、性别=女。 处理分类属性 将关联分析用于二元化后的数据时,需要考虑如下问题。 (1)有些属性值可能不够频繁,不能成为频繁模式的一部分。如:州名。 解决办法:将相关的属性值分组,形成少数类别。例如,每个州名都可以用对应的地理区域取代。例如:分别用中西部、太平洋西北部、西南部和东海岸取代。 处理分类属性 将关联分析用于二元化后的数据时,需要考虑如下问题。 (2)某些属性值的频率可能比其他属性高很多。如:假定85%的被调查人都有家庭计算机,如果为每个频繁出现在数据中的属性值创建一个二元项,我们可能产生许多冗余模式。 {家庭计算机=是,网上购物=是
您可能关注的文档
- 波浪理论进化版精选.ppt
- 第7章国际金融市场与国际金融创新讲述.ppt
- 第7章国际资本流动与国际金融危机讲述.ppt
- 第7章国债与国债市场讲述.ppt
- 烟台理工学院《基础大学英语》2021-2022学年第一学期期末试卷.doc
- 2026年福建省厦门市松柏中学3月高三第一次在线大联考(江苏卷)含解析.doc
- 江苏省苏州市苏州中学2025-2026学年高三模拟考试英语试题(文史类)含解析.doc
- 山东省青岛市胶南市2025年数学六上期末调研试题含解析.doc
- 2025届河南信阳市息县第一高级中学、第二高级中学、息县高中高一生物第二学期期末联考模拟试题含解析.doc
- 新疆哈密石油中学2023-2024学年高三(最后冲刺)英语试卷含解析.doc
- 广东省深圳市福田区侨香外国语学校2025届数学八上期末经典模拟试题含解析.doc
- 2025届湖南省浏阳市初三下十月阶段性考试试题语文试题含解析.doc
- 江西省江西师大附中2026届高三第六次质量检查生物试题含解析.doc
- 江苏省连云港市灌南县2025年三上数学期末质量跟踪监视模拟试题含解析.doc
- 银川科技学院《社交礼仪》2023-2024学年第一学期期末试卷.doc
- 江苏省南京雨花台区七校联考2025届初三下学期第一次周考语文试题(重点班)试题含解析.doc
- 山东省滨州市十二校2025届高一语文第二学期期末综合测试试题含解析.doc
- 西昌学院《经济法》2021-2022学年第一学期期末试卷.doc
- 邯郸市邯山区2024-2025学年四下数学期末复习检测模拟试题含解析.doc
- 安徽林业职业技术学院《毒理学基础A》2023-2024学年第二学期期末试卷.doc
最近下载
- 《个人所得税纳税申报》公开课上课课件.pptx VIP
- 2026年医院财务科人员招聘考试题及答案.docx VIP
- 小米培训课件.ppt VIP
- 内科护理学_专业知识-第六章 血液及造血系统疾病病人的护理.pptx
- 2025年山东省济宁市中考英语试卷含答案.pptx VIP
- T_CEC 1247—2025 架空输电线路杆塔及基础光纤监测装置技术条件.docx VIP
- 环境因素及危险源识别.pdf VIP
- 古诗词艺术歌曲《定风波·莫听穿林打叶声》的艺术特征与二度创作.pdf
- 2026年四川省从“五方面人员”中选拔乡镇领导班子成员考试历年参考题库含答案详解.docx VIP
- 2026年春国开电大应用写作(汉语)形考任务2.docx
原创力文档

文档评论(0)