- 1
- 0
- 约1.27万字
- 约 92页
- 2019-01-11 发布于天津
- 举报
Chapter06商业智慧基础.ppt.ppt
* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 確保資料品質: 政府機關及企業體的資料庫在資料品質上非常差 全國消費者信用報告資料庫的錯誤率達到20-35% 在聯邦調查局的電腦犯罪歷史記錄中,有32%是錯誤的,或不完整的,或模擬兩可的 Gartner Group深信顧客資料正以每個月百分之二的比例降低品質 建立資料庫環境 * 企業決策的品質與資料庫中資料的品質有直接的關聯 資料品質稽核:有組織、有計畫的調查資訊系統中資料的準確度與完整性 資料淨化:調查活動的一致性與修正資料庫或是檔案裡不正確、不完整、不適當格式化或是重複的資料 建立資料庫環境 確保資料品質:(續) * 技術視窗:MySpace背後的資料庫 MyS是知名的社交網絡網站,經歷了網際網路歷史上其中之一的最大幅成長加速。該網站在2003年11月成立,而到了2007年5月它有1.57億的會員。MySpace的挑戰是避免技術上的落後降低網站的效能並阻撓它快速擴張使用者的網路。 像MySpace這樣網站的技術需求是與其他大流量網站有所不同。一般來說,有一些人會一天幾次改變新聞網站的內容。網站也許收到數千個對底層資料庫的讀取需求,而不用更新資料庫。在MySpace中,數千萬個使用者同時更新他們的內容,提高了資料庫互動的比例,需要更新底層的資料庫。每一次當使用者檢視在MySpace上的個人資枓,結果的頁面是由多個資料庫查詢組成,組織的資訊是來自於位於多個伺服器中的多個資料庫上儲存的數個資料表格。 * 在一開始的階段,MySpace運作二個網站伺服器連結一個資料庫伺服器與微軟SOL Server資料庫。這樣的開始對於小型與中型的網站是合適的,因為其簡單性。在MySpace中,這樣的配置在更多使用者登入時就顯得吃緊了。 一開始,MySpace藉由增加網站伺服器而減少負載並處理增加的使用者需求。但當帳號數目在2004年增加至50萬,一個資料庫伺服器是不夠的。部署額外的資料庫伺服器比增加網站伺服器還複雜,因為資料必須切割成為數個資料庫而不能無法讀取或減少效能 MySpace部署了三個SOL Server資料庫.一個伺服器作為主資料庫,接收所有新的資料並複製到另外二個資料庫。這些資料庫主要取出使用者頁面需求的資料。 當MySpace的帳號數逼近200萬個時,資料庫伺服器也逐漸達到其輸入/輸出的容量,也就是可以讀取與寫入資枓的速度。這使得網站在內容更新上會延遲。MySpace改採用垂直切割模式,讓不同資料庫支援不同的網站功能如登入畫面、使用者基本資料與部落格。 然而,這些不同的功能有時也會分享資料,而當該網站達到300萬個會員時會產生問題。除此之外,網站的有些功能成長的太過快速,使得單一伺服器無法負荷。 * 在考慮過投資更多強力與昂貴伺服器的擴張策略後,MySpace反而是額外增加了許多便宜的伺服器來分擔資料庫的工作負載。更經濟的分散式架搆的解決方案需要新的設計,將所有的伺服器整合如同一個邏輯電腦般的運作。在此設計下,仍需要透過將使用者帳號切割成每群100萬個的群體而分散工作負載,並將所有與這些帳號相關的資料放置在一個分開的SQL Server中。 雖然在效率上得到改善,但工作負載並沒有平均的被分散,有時候會引起特定資料庫的儲存區域超載。MySpace試著以人工作業來修正此問題,但此作業是吃力的並且不能有效的利用資源。因此MySpace改採用虛擬儲存架構,不再使用將附加磁碟專屬於特定應用軟體,而是採用所有應用軟體可用的單一儲存池。在這樣的安排下,資料庫可以寫入資料到任何可用的磁碟,因此減少一個應用軟體專屬的磁碟變成超過負載的可能性。 * 在2005年,MySpace也加強了基礎建設,在位於資料庫伺服器與網站伺服器間安裝了一層伺服器,儲存與提供經常被使用的資料物件,因此該網站的網路伺服器就不需要經常查詢資料庫伺服器。 雖然有這些方法,MySpace仍然比其他主要的網站更長超過負荷,使用者表達了對於無法登入或觀看某些網頁的挫折。某些日子裡登入錯誤發生的機率在20%到40%。網站的活動持續挑戰技術的限制。到目前為止, 該網站持續的成長顯示使用者仍願意忍受「非預期錯誤」畫面。 MySpace的開發者仍持續重新設計網站的資料庫、軟體與儲存系統, 以跟上它爆炸性的成長, 而它們的工作永不會完成。 * * 結論 本章旨在介紹資料管理與企業如何使用資料庫科技來達成目標。一旦企業使用資料庫管理系統將資料適當的組織後,這些資料就可以被分析。產出的資訊可用於
您可能关注的文档
- 10.专家系统与智慧型资料库.ppt
- 102年度第一期社区生活营阳光青少年辅导活动醒狮社团-岸内blogs.ppt
- 106学年度园艺教师社群成果报告.PDF
- 107年度友善校园学生事务与辅导工作计画-学辅传承会议.ppt
- 1共代谢简介早期研究发现甲烷假单胞菌能够在生长基质存在时对非生长.doc
- 2013年百名博士防城港行科技服务活动科技研发项目(一)项目1粮油.doc
- 2015年行业指导职业院校专业改革与实践项目J14水肥一体化精准灌溉.doc
- 2017咸宁质量状况.PDF
- 2018年复试体检工作安排-环境与能源工程学院-北京建筑大学.doc
- 2019年度国家技术发明奖提名项目公示-四川大学.PDF
最近下载
- 新概念英语第一册上半册 Lesson15-16 课件.ppt VIP
- 2025 年剖宫产术后护理的最新要点与技巧.docx VIP
- 医院科室排班表.docx VIP
- 楼宇低压配电系统的设计.doc VIP
- 【电脑小知识】:如何使用注册表来恢复误删的Win7便签?.docx VIP
- 班子(在带头强化政治忠诚、提高政治能力;在带头固本培元、增强党性;在带头敬畏人民、敬畏组织、敬畏法纪;在带头干事创业、担当作为;在带头坚决扛起管党治党责任)存在不足.docx VIP
- 2024年山东省高考数学试卷(理科).doc VIP
- 一把手 2025年度在带头强化政治忠诚、提高政治能力;在带头固本培元、增强党性;在带头敬畏人民、敬畏组织、敬畏法纪;在带头干事创业、担当作为;在带头坚决扛起管党治党责任五个带头方面存在的问题.docx VIP
- 四川成都农业科技中心招聘真题2024.docx VIP
- 四库全书基本概念系列文库:韵略汇通.pdf VIP
原创力文档

文档评论(0)