- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
资料采矿与资料仓储
第六章 資料採礦與資料倉儲
6-1 資料採礦意義與特性
6.1.1 資料採礦的意義
就是「從大量的資料庫中找出相關的模式(Relevant Patterns),並自動地萃取出可預測的資訊」。它是利用完備的統計與機器學習(Machine Learning)技術,來建立能自動預測顧客行為的模型,同時還能與資料倉儲結合,發展出有價值的商業用途。資料採礦技術可應用在下列六個方向:1.獲取「新」客戶;2.維繫「舊」客戶;3.剔除「壞」 客戶;4.客戶購物籃分析(Basket Analysis);5.需求預測與目標行銷;6.交叉行銷(Cross-selling)與主動行銷(Up-selling)。6-4 資料倉儲意義與特性
6.4.1資料倉儲的意義:
從技術面來看,它是一個集中儲存電子資訊的所在。不同來源、不同型態的資料經過清理(Cleaning)、轉換(Transformation)後,以的型態有組織的排列,儲存於倉儲內以供分析。所以,廣義的資料倉儲指的是整體的解決方案,除了資料集中儲存,還包括連線分析(On-line Analytical Processing,簡稱OLAP)。從應用面來看,資料倉儲是現代企業資訊系統架構的核心,為企業提供快速的、整合的、具分析性的資訊服務。傳統資料庫著重於「微觀查詢」,也就是使用者可以查詢到他所需要的各項資料,而資料倉儲則著重在「宏觀查詢」,也就是其所提供的資訊可以協助高階主管了解與掌握問題。6-5 資料倉儲執行步驟與執行方法
在此以汽車業者執行資料倉儲的步驟與方法進一步介紹,在市場競爭情勢及企業內部資料管理架構不足的原因驅動下,汽車業者高層決定投入顧客關係管理專案的經營及開發。汽車業者採取的第一個動作是建置資料倉儲系統,亦即是將依企業各個部門使用者不同的需求層面建立資料架構,重新開發適當的系統模型,以強化資料收集及分析的能力。顧客關係管專案的建置,是藉由分析企業使用者需求,以「維度模型」(Dimension Model)重新測度及規劃出汽車業者顧客資料的構面,且檢視原先資料架構及內容不足和正確性。建置資料倉儲系統的步驟:1.企業使用者需求分析 在定資料來源前,必須先充分了解企業使用者的需求。在階段中,首先須清楚汽車業者各個部門使用者對資料採礦及資料分析的切入構面,以及相關的分析資料需求。例如業務部門會希望了解台灣各個縣賣出車型的資料,那麼就可將資料分析的切入構面設定為區域;或者是要了解特定時段內銷售的車型或是數量,則切入的構面就是「汽車掛牌時間」。除了這些銷售端的資料外,顧客在購買汽車後,與公司最重要的互動就是回廠維修。所以利用維修廠的工作報單(簡稱工單)中的項目,如:維修項目、更換的零件、維修時間、維修金額、車主等為中心,而輔以經銷商手中汽車購買時間、汽車掛牌時間、掛牌區域等資料,即可建立完整的顧客資料維度模型。2.建立資料模型 此階段的主要目標即是依各個使用者對資料內容的需求,規劃出適當且足夠的欄位,供資料的紀錄輸入及往後的分析,同時決定是採用「一次劃足」(Full Table)「漸次增加」(Incremental)的設計模式。 同時在「線上即時分析處理「(On-Line Analytical Processing , OLAP)功能的設計上,也必須同時考量資料的深度(是否能擷取整體的企業資料,甚至是最細項的資料?)、報表的範圍(能否涵蓋全面性的問題範疇?)及資料的廣度(系統是否能滿足企業營運上各種應用需求?)。 此階段中,還有一項非常重要的工作,就是定義所謂的「中介資料」(Metadata)。中介資料事實上就是資料表格欄位與分析報表中企業觀點的對照關係,因為對企業使用者而言,閱讀報表者通常並不了系統與欄位設計,因此如何將系統設計與企業實際需求串連整合,就要透過完整正確的「中介資料」,所以設計要定義「中介資料」必須同時了解資料庫的設計及企業觀點。以汽車業者為例,其中介資料包括「維度物件」與「量測物件」。維度物件即是各個業務分析觀點及事物分類,亦即查詢或觀察資料的角度,包括:車型、工作代號及維修種類等;而量測物件則為各種隨維度物件而變化的運算數值,通常是可以加總的數值資料,如維修金額、車次及工單數。汽車業者所有的中介資料中,最重要的應該就是所謂的RFM:是指最近一次消費(Regency)的相關資料,如最後一次進廠日、最後一次保養日等。是指消費頻率(Frequency)的相關資料,如購買車次等。是指消費金額(Monetary)的相關資料,如零件、工作項等金額。同時,為有利於用者解資料,在設計中介資料的階層時,應該由最概括性的資料深入細分到最特定資料,如車種--車系--底盤前三碼--底盤前六碼。因此一個完整的資料模型要能順利且有效率的運作,必須充分整合維度模型、OLAP的設計及中介資
文档评论(0)