第46期电子报-关贸网路.PDF

第46期电子报-关贸网路

關貿第46 期電子報 哈燒話題: 巨量資料新生活 Big Data 為2013 年台灣IT 產業最熱門的名詞之一,在數位化的潮流之下,「巨量 資料」分析已成為創新競爭力的一大關鍵,也是世界各先進國家與企業投入研究的重 要領域。 資料分成結構化資料、半結構化資料、非結構化資料三種型式。結構化資料是指 資料經過分析後可分解成多個互相關聯的組成部分,各組成部分間有明確的層次結 構,其使用和維護通過資料庫進行管理 ,並有一定的操作規範。我們通常接觸的資料 庫庫管理的資料,包括生產 、業務、交易、客戶資料的記錄都屬於結構化資料。非結 構化資料,資料格式不固定,常常是各種形式的資料,例如圖像、聲音、影片等資料 皆屬於非結構化資料。半結構化的資料介於結構化資料和非結構化資料之間,資料格 式以文字為主,但每個欄位填入資料的內容和長度則不固定。電子郵件、網路社群討 論文章皆屬於半結構化資料。下圖為商業智慧分析(Business Intelligent)到巨量資料分析 (Big Data)的過程,從圖中可以發現,越往右上分析資料多樣性、不確定和資料大小亦 逐步增加。且商業智慧分析(BI)主要分析企業內部營運和客戶資料,巨量資料分析(Big Data)分析的範圍更加廣泛,舉凡社群互動、悠遊卡交易紀錄

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档