- 25
- 0
- 约小于1千字
- 约 56页
- 2017-06-10 发布于四川
- 举报
第八章 聚类分析;8.1 什么是聚类分析;;8.2 聚类分析中的数据类型;;;;;;;二元变量
一个二元变量只有两个状态:0 或 1,0 表示该变量为空,1 表示该变量存在。
二元变量的可能性表
q 是对对象 i 和 j 值都为 1 的变量的数目,r 是在对象 i 中值为 1,在对象 j 中值为 0 的变量的数目,s 是在对象 i 中值为 0,在对象 j 中值为 1 的变量的数目,t 是在对象 i 和 j 中值都为 0 的变量的数目。变量的总数是 p,p=q+r+s+t。;;;例:二元变量之间的相异度:假设一个病人记录表包含属性 name, gender, fever, cough, test-1, test-2, test-3, 和 test-4,这里的 name 是对象标识,gender是对称的二元变量,其余的属性都是非对称的二元变量。
大部分为二元属性的关系表
假设对象之间的距离只基于非对称变量来计算。根据Jaccard系数公式:
d(jack,mary) = (0+1)/(2+0+1) = 0.33
d(jack,jim) = (1+1)/ (1+1+1) = 0.67
d(jim,mary)=(1+2)/(1+1+2) = 0.75
上面的值显示 Jim 和 Mary 不可能有相似的疾病,因为他们有着最高的相异度。在这三个病人中,Jack 和 Mary 最可能有
您可能关注的文档
- 第九章-第1部分(弯矩分配法)2012.ppt
- 第九章6Sigma管理简介.ppt
- 第九章人格理论.ppt
- 第五课和同为一家.ppt
- 湖南华曙高科及SLS激光快速制造技术.ppt
- 第九章住宅.ppt
- 第五课《多元文化“地球村”》课件(人教新课标八年级上)2015.ppt
- 第九章信息资源共建共享.ppt
- 第九章公共关系专题活动.ppt
- 第五课和同为一家我的课件.ppt
- CN118228103B 基于网络模式和元路径的双视图范式的异构图神经网络节点分类方法 (华南理工大学).docx
- CN118207835B 一种联合火箭锚与植桩技术的堤防决口快速封堵方法 (大连理工大学).docx
- CN118211675B 基于机器学习消除冗余约束的机组组合加速寻优方法及系统 (中国电力科学研究院有限公司).docx
- CN118297473B 电力系统电压安全评估及优化方法、系统、设备和介质 (国网经济技术研究院有限公司).docx
- CN117997906B 节点计算资源分配方法、网络交换子系统及智能计算平台 (广东琴智科技研究院有限公司).docx
- CN118298536B 一种基于智慧社区监控系统的门禁授权认证方法及系统 (广州市西迈信息科技有限公司).docx
- CN118225438B 大功率霍尔推进器在轨健康状态监测方法 (哈尔滨工业大学).docx
- CN118052938B 一种基于多源数据融合的建筑物多细节层次模型重建方法 (北京市测绘设计研究院).docx
- CN117964706B 一种十五元环缩肽类化合物及其制备方法与应用 (广西中医药大学).docx
- CN118081766B 一种面向协调类任务的双臂机器人主从统一导纳控制方法 (南京航空航天大学).docx
最近下载
- 2026年铁岭卫生职业学院单招职业倾向性考试题库附答案详解(完整版).docx VIP
- 贵州喀斯特石漠化地区高速公路绿色建造(每日一练).pdf VIP
- 论夫妻婚前个人财产婚后收益的归属:法理辨析与实践审视.docx VIP
- 2026山东日照银行校园150人招聘参考笔试题库附答案解析.docx VIP
- (高清版)DB32∕T 4853-2024 堤坝道路工程技术规范.pdf VIP
- 儿童绘本图书《活了100万次的猫》.pdf VIP
- 电气倒闸操作票格式.doc VIP
- ABB SACE HF空气断路器.pdf VIP
- 2026年最新管理学原理中级考试题及答案.doc VIP
- 2025_2026学年广东省广州市从化区九年级上册语文期末试卷(文字版,含答案).docx VIP
原创力文档

文档评论(0)