- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
中文古籍全文资料库建置比较研究-国家图书馆
BIBLID 1026-5279 (2001) 90:2 pp. 197-216
國家圖書館館刊 九十年第二期(2001.12) 1 9 7
中文古籍全文資料庫
建置比較研究
顧 力 仁
摘 要
中文古籍全文資料庫的建立,包括「逐字輸入」以及利用「光學文字辨識技
術」等兩種方式。本文以中央研究院的「漢籍電子文獻資料庫」、中華電子佛典
協會的「漢文電子大藏經」、香港迪志文化出版有限公司的「文淵閣四庫全書電
子版」以及國家圖書館的「古籍無定型工整手寫文字辨識、檢索與管理系統」等
電子資源為例來介紹中文古籍全文資料庫的發展現況,並就建立中文古籍全文資
料庫所牽涉到的問題,包括:輸入方式、校對問題、缺字及造字、標誌及標準格
式、檢索等問題加以討論,以瞭解圖書館目前以及未來在建立中文古籍全文資料
庫此一課題上所面對的問題及發展趨勢。
一、 前 言
由於資訊數位化及網路技術的演進,促使數位圖書館的興起,數位圖書館具
有資訊保存、組織、展示、利用、教育推廣與研究等功能。也由於社會大眾對文
化及歷史資產的重視,圖書館珍藏的歷史文獻遂成為數位化的重要對象,例如:
UNESCO Memory of the World 、National Digital Library Program 以及國內國科
關鍵詞(Keywords ):古籍;古籍整理;全文資料庫;光學文字辨識;標誌
Digital Library ;O rganization of Ancient Books ;Image Processing ;
MARC ;Metadata
顧力仁:國家圖書館特藏組編輯;E-mail: klj@.tw
1 9 8 國家圖書館館刊 九十年第二期(2001.12 )
會擬進行的「國家典藏數位化計畫」都是重要的圖書館珍藏文獻數位化計畫。
隨著資訊科技對圖書館作業型態的影響,古籍的整理也起了相當大的變化,
[1]
武亞民論及「數字圖書館與古籍整理的關係」中認為:
1 . 數字圖書館。(即「數位圖書館」,另有譯成「數據圖書館」)將各種不同類
型的文獻信息有機地結合在一起,因此古籍成為數字圖書館中不可缺少的信
息源之一;
2 . 中國的數字圖書館在建設的過程中必須考慮和首先解決古籍的中國傳統文化
特徵,這是具有中國特色的數字圖書館的關鍵。
由此可知,借諸現代化的手段,古籍的整理、組織與利用逐漸成為圖書館的
重要職責。
此外,謝清俊教授更強調在網路環境中,古籍可藉由電子媒體充分將其優越
[2]
性質表達出來,因為:
1 . 古籍的電子版本可無限地複製,是取之不盡、用之不竭的資源,可供全民共
享。
2 . 透過網路,電子古籍可以瞬息千里,沒有運輸和分配的問題。
3 . 電子版本的古籍容易匯集,鉤稽參照後,能產生新的訊息。
4 . 電子古籍好儲存,體積小,便於檢索、應用及處理。
所以他認為電子化的古籍是使古籍活出最佳現代風貌、也是唯一的選擇。
圖書館除了應善盡存護古籍的責任外,尚須設法提供使用者有關古籍內文中
的「知識」。古籍中知識的獲取有賴先整理出其「線索」,所以古籍的「內容」及
「線索」是整理工作的兩個重要對象,而數位圖書館中的古籍整理也以此兩者為
鵠的。數位圖書館提供古籍「內容」所用的方式包括影像化及建置全文資料庫,
前者重現古籍原貌,以便即時閱覽、傳遞及列印;後者將古籍全文轉為電子本
文,以便檢索、儲存及編輯。此外,圖書館也進行網路上古籍資源的組織與檢
索,藉以描述並揭示古籍的「線索」。本文以「古籍全文資料庫」為例,藉以瞭
解資訊科技對於圖書館收藏中文古籍的影響。
圖書館為什麼要發展「古籍全文資料庫」?這個問題牽涉到兩方面,一方面
[1] 武亞民,〈數
文档评论(0)