中文报业数位化技术与现况探讨.pptVIP

  • 1
  • 0
  • 约小于1千字
  • 约 19页
  • 2018-03-12 发布于四川
  • 举报
中文报业数位化技术与现况探讨.ppt

中文報業數位化技術與現況探討 -以聯合知識庫數位化經驗為例 淡江大學資訊與圖書館研究所研究生 孫正宜 淡江大學資訊與圖書館研究所副教授 林信成 壹、報紙文獻的價值 今日的新聞 明日的歷史  -全社會檔案  -第一手文獻  -內容豐富  -具獨特性  -具有序性  -具可近性 貮、報紙文獻數位化的技術 -影像掃描(標題建置) -重新打字 - OCR 文字光學辨識 -電子報直接轉入資料庫 參、回溯報紙數位化概況 -中國時報 -中央日報 -聯合報系 -世新世界日報 -大陸人民日報 -大陸解放軍報 肆、個案研究 -聯合報數位化動機 -正派辦報,留下歷史軌跡。 -Internet是趨勢,更是不歸路  ,如果無法退縮,就得積極加入。 聯合知識庫數位化現況 即時內容 -目前有近500萬筆新聞 -1999.9.31起電子檔入庫 -聯合報、經濟日報、民生報、  聯合晚報、星報五報新聞 -每日見報180塊版、1500則新聞 聯合知識庫數位化現況 回溯內容 聯合報:1975~1999年     1,612,357則,九億字。 經濟日報:1988~1999年     1,297,090則,六億字。 民生報:1988~1999年     910,108則,四億個字。 聯合知識庫回溯資料數位化技術 -多核心辨識技術 -批次集字校對 聯合知識庫回溯資料數位化過程 影像掃描 切字辨識 集字校對 逐字

文档评论(0)

1亿VIP精品文档

相关文档