数据科学与工程研究所.doc

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
PAGE 1 PAGE \* MERGEFORMAT9 課程結構與內容 本碩士班規劃於修業年限內需修畢24學分,其中必修15學分,選修9學分。為達成上述教育目標與特色,規畫課程分為「預備先修課程」、「基礎核心課程」與「進階選修課程」(請參見數據科學與工程碩士班課程地圖,圖一)。 「預備先修課程」旨在要求學生具備基礎的程式語言能力與統計概念,以利於順利銜接本所碩士班所開設的課程。學生需於入學前透過自學或實際修課的方式,或入學後透過補修的方式,滿足預備先修課程的要求。 「基礎核心課程」是為了讓學生學習與實作從事大數據分析時所需的電腦程式、數據分析、資料視覺化之相關方法,和數據工程 (Data Engineering) 層面上的問題,以培養同時具備這些技術的人才。其中「資料探勘」與「統計方法」教授基本的資料探勘/分析的電腦演算法/統計方法,為數據分析技術的核心課程。「數據科學概論與軟體實務」學習與整合大數據分析在資料存取、分析與視覺化階段所使用的軟體,讓學生通盤了解可運用的商用或open source工具的現況,是執行電腦實作時不可或缺的能力。「數據科學演講」課將定期邀請從事大數據分析與研究的業界、學界人士,前來發表專題演講,分享他們欲解決的問題、經驗與成果,以增廣學生在大數據領域的眼界。又課程亦會安排學生,就參與的計畫或參加的競賽做一個分享,訓練其表達能力,讓他們成為一個“會說故事”的數據科學家。「巨量資料技術與應用」涵蓋處理大量、快速、多樣資料時運算環境的建置(包含:Hadoop、Spark、Mahout、Graph Models、Data Streams…等),此為數據系統與工程上的核心問題。「數據科學專題」將透過實際參與資料科學競賽的方式,讓學生組隊參加比賽接觸實際的巨量資料,實作巨量資料分析與學習團隊合作。 「進階選修課程」分為資訊、統計與應用數學領域,是要讓學生進一步專精大數據分析其中一領域,培養具備改進與研發新技術能力的人才。這部分的課程將來自現有資訊學院、理學院之統計所與應用數學系/所之相關專業學科,學生可依據碩士論文主題或與論文指導教授討論選修。 為培養學生的專業領域???識,我們將鼓勵修習其他系所開設的基礎應用課程,如:管理學院的「管理科學導論」、「財務管理」、「經濟學」、「會計學」,生物科技學院的「普通生物學」,電機學院的「電子學」,資訊學院的「資料結構」、「物聯網概論」、「網路通訊原理」,理學院的「物理」、「化學」…等課程。 各別課程的主要內容說明,請參見表一。相關課程的開設學期別,則如表二所示。建議的修課順序,第一年上學期可修「基礎核心課程」中的必修I:「資料探勘」、「統計方法」、「數據科學概論與軟體實務」。第一年下學期則修習「基礎核心課程」中的必修II:「巨量資料技術與應用」、「數據科學專題」。第一年下學期與第二年上學期可依學生自己的專長與興趣,選修「進階選修課程」中某一領域的課程。所有學生至少需修習兩學期的「數據科學演講」,我們亦鼓勵至少修習一門其他系所開設的基礎應用課程。 圖一:數據科學與工程碩士班課程地圖 表一:課程內容簡介 課程名稱課程介紹授課教師資料探勘 (必修、3學分)本課程主要教授基本的資料分析/探勘的演算法,其中包含關連式法則探勘(association rule mining)、分群法(clustering algorithms)、分類法 (classification)、時序性資料探勘 (time series data mining)、Web mining、social media mining及Text mining等。本課程也會探討部分數據工程 (Data Engineering) 層面上的問題,包括處理大數據多樣、非結構與大量等特質時,在工程上要做的系統研發與運算環境建置。本課程將要求學生實際參與資料分析競賽或是專題,實際運用資料探勘演算法,與相關資料分析程式的實際撰寫。彭文志統計方法 (必修、3學分)本課程將以實際的巨量資料為核心,搭配統計軟體R的使用,引導課程參與者接觸並學習統計基本原理、資料探索方法(exploratory data analysis)、統計檢定(statistical hypothesis testing)相關的概念和方法、迴歸分析(regression analysis)、主成份與因素分析(principal component and factor analysis)、集群分析(cluster analysis)、分類與判別分析(classification and discrimination analysis)等資料探勘(data mining)相關的概念和方法。上課內容,將廣泛包含所有相關知識,上課時側重講述

文档评论(0)

youbika + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档