- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
亚洲大学生物与医学资讯学系.PDF
亞洲大學 生物與醫學資訊學系
99 學年度第 2 學期 (期中考)
科目 :資料探勘 (Data mining)
考試日期 :
地點 :
一、選擇與填充 (40%)
1. 資料探勘的目的是在資料中發現前所未知的趨勢與_樣式樣式_
樣式樣式
2. 彙總統計屬於量化的資料包括資料的次數 ,資料的_落點落點_和資料的分佈
落點落點
3. 當相關係數為 0 表不具_線性線性_ 關係
線性線性
4. We are drowning in data, but starving for knowledge. 其中 drowning 為 A) 丟
棄, B) 拖曳, C) 淹沒淹沒, D) 飢餓
淹沒淹沒
5. _眾眾_數是指具有最高次數的屬性值
眾眾
6. 變數轉換時的正規化目的是將變數轉換成_常態常態_分配 ,以使整個值的單位一
常態常態
致
7. 當距離公式滿足正向性 、對稱性及_三角不等式三角不等式_時,則稱為 metrics (度量)
三角不等式三角不等式
8. Analysis 是 A)安裝, B) 分析分析, C) 分享, D) 設定
分析分析
9. Euclidean distance 指的是 A) 敏可夫斯基距離, B) 歐氏距離歐氏距離, C) 漢明距離, D)
歐氏距離歐氏距離
曼哈頓距離
10. 特徵的產生有三種方法 ,包括將資料映射到新的空間、特徵的建構與_特徵的特徵的
特徵的特徵的
萃取萃取_
萃取萃取
11. Tukey 所發展的 EDA 將分群分析與_異常偵測異常偵測_皆視為資料探索技術
異常偵測異常偵測
12. 關係係數值介於-1 到 1 ,當值為 1 時表_完全完全 _相關
完全完全
13. Diaper 是 A) 化妝棉, B) 尿布尿布, C) 溼紙巾, D) 面紙
尿布尿布
14. 屬性型態可大致分為定性與_定量定量_
定量定量
15. 一個屬性是指物件的_特性特性_ ,而其特性可能會隨時間而變動
特性特性
16. 將資料視為將資料視為多維度資料的步驟有二個 ,包括維度的識別與_屬性屬性_
屬性屬性
識別
17. 線上分析處理強調_互動互動_性的分析資料 ,並且提供視覺化資料的能力及產生
互動互動
彙總統計的資訊 ,因此OLAP 系統適合做為多維度資料分析的主要分析方法
18. 大部分的資料都可視為一個表單 ,而表單中的每一列為一個_物件物件_ ,同時每
物件物件
一行為一個屬性
19. Slicing 指的是 A) 滑球, B) 投影片, C) 切片切片, D) 切割
文档评论(0)