- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2.1 資訊與數據的分別 2.6 數據處理 2.2 數據的收集及準備 2.7 資訊處理 2.3 錯誤來源 2.8 成批處理 2.4 數據有效性及數據校驗 2.9 實時處理 2.5 數據結構 課前討論 你會使用傳統的圖書館卡片目錄嗎? 你會使用學校的圖書館系統嗎? 2.1 資訊與數據的分別 數據經過處理,成為資訊 2.1 資訊與數據的分別 數據 收集到的、尚未經過組織的原始內容 本身沒有或只有很少的含義 資訊 經過了處理的數據,它具有一定的意義 有一定用途 一般而言,數據處理過程分為五個步驟: 1. 數據收集 2. 數據準備 3. 數據輸入 4. 數據處理 5. 資訊輸出 2.2 數據的收集及準備 2.2 數據的收集及準備 2.2.1 數據收集 根據某一特定目的而展開的 所收集的原始數據一般稱為源文件 問卷、訪談和觀察 2.2.2 數據準備 把數據進行預前處理,使其格式適合接下去的處理步驟 工作:檢查數據的準確性和對數據進行分類。 2.3 錯誤來源 2.3.1 錯誤來源 2.3.2 無用輸入.無用輸出 2.3.1 錯誤來源 因人手輸入而產生的錯誤: 數據源錯誤 轉錄錯誤 調換錯誤 2.3.2 無用輸入.無用輸出 Garbage In Garbage Out, GIGO 為電腦工業中的流行術語 表示電腦輸出的質量依靠於它輸入的質量 2.4 數據有效性 及數據校驗 2.4.1 數據有效性 data validation 2.4.2 模檢數 modulo check 2.4.3 檢查數位 check digit 2.4.4 數據校驗 data verification 2.4.1 數據有效性 數據有效性 (data validation) 將數據與一系列標準或數值進行比較,從而保證數據值的合理性 無效的數據通常都含有錯誤或偏差 通過數據有效性的檢查,可以找出源檔案中的錯誤 2.4.1 數據有效性 五個不同的數據檢查 域完整性的檢查 確認具備了所有必須的字段 字段長度的檢查 確認每項數據都具有正確字串的長度 範圍檢查 確認數據值在預先確定的範圍內 格式檢查 確認數據的類型符合指定的格式 檢查數位 在實際數值之後加上一個檢查數位 2.4.2 模檢數 模檢數(modulo check) 算法的一種 用於檢查一個數字的有效性 2.4.3 檢查數位 檢查數位 (check digit) 使用十分廣泛 如國際標準圖書編號(ISBN)和身份證號碼中都用到了檢查數位 例:ISBN 2.4.4 數據校驗 數據校驗 (data verification) 確保數據在轉換過程中沒有差誤的環節 雙重輸入 讓一個操作員輸入同一數據兩次,由電腦系統對內容進行校驗 由兩個人獨立輸入 讓兩位不同的操作員依同一來源的文件進行輸入,並貯存到不同的檔案裏,再進行校驗 前者比後者較為優勝,但是卻須要較多人手 2.4.4 數據校驗 2.5 數據結構 2.5.1 分層式的數據結構 2.5.2 關鍵字段 2.5 數據結構 2.5.1 分層式的數據結構 2.5 數據結構 2.5.2 分層式的數據結構 關鍵字段(或主關鍵碼) 用來識別數據庫中的一個記錄 是唯一的, 沒有兩個記錄有同一個字段的值 2.6 數據處理 2.6.1 排序 2.6.2 搜尋 2.6.3 合併 2.6 數據處理 2.6.1 排序 把數據以一順序的排列 排序鍵 利用進行排序的關鍵字段 記錄重新排序後,為了標明記錄在新序列中的位置,每一條記錄都將被賦一個新的記錄號 2.6 數據處理 2.6.2 搜尋 從大量的數據中找出所需要的資訊 順序搜尋 對一個數據庫中的所有記錄逐條由首至尾或由尾至首的進行核對 適用在非順序的數據中 二分搜尋 用於已排序的記錄中搜尋出某一特定記錄的方法 先找到記錄的中點處,即每次將待搜尋的記錄分半,只對一半的記錄進行搜尋,直到發現要查找的記錄 2.6 數據處理 2.6.3 合拼 把至少兩個或以上的數據檔案產生出一個新檔案 若檔案中的記錄都是順序的,合併後出來所得的檔案都要為同一順序的方式 2.7 資訊處理 2.7.1 資訊重新整理 2.7.2 資訊轉換 2.7.3 資訊通訊 2.7.4 資訊傳輸 2.7 資訊處理 2.7.1 資訊重新整理 資訊可以以不同的結構演示 然而並非一建立的資訊結構就能滿足某一要求或需要 2.7.2 資訊轉換 資訊可以以不同的格式演示 將資訊從一種數碼檔格式轉換成另一種數碼檔格式 務必避免在轉換過程中丟失數據 2.7 資訊處理 2.7.3 資訊通訊 兩處地點進行資訊交換 它們都必須依同一個通訊傳輸的方式來進行資訊傳輸,已達致通訊的目的 TCP/IP 是互聯網上的通訊協定。 2.7 資訊處理 2.7.4
文档评论(0)