- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
五十年来台湾人文学术研究丛书文献学与图书资讯学
五十年來台灣人文學術研究叢書----文獻學與圖書資訊學
台灣地區中國古籍文獻資料數位化的過程與未來的發展方向
元智大學?羅鳳珠
2000年11月,學生書局出版
前言
網際網路的發明,無疑的是近代文明發展的一件大事,資訊科技的影響力,也在這幾年之內涵蓋全人類的每一個層面,每一個角落。各學門、各行業引用資訊科技作為輔助工具,也幾乎到了無所不及的地步。文史學門引用資訊科技作為輔助工具,應該是各學門之中起步較晚的一個領域。
中文資訊技術有計畫的應用在中文文獻資料的處理上,當屬中研院於1984年7月開始的「史籍自動化計畫」為最早,該計畫為開發《廿五史》全文資料庫而成立,其基本目的是選擇對中國傳統人文研究具有重要價值的古代文獻,建立電腦全文資料庫,作為學術研究的輔助工具。在輸入文獻的選擇上,以中研院研究人員的專長與興趣為主要考量,第一年先將部份的《食貨志》建立全文機讀檔案,第二年持續將《廿五史》全部的《食貨志》建檔,在功能上也往前推進一大步,其後《廿五史》全部資料亦陸續建立。
網際網路的技術引進國內之後,筆者首先於1993年將《紅樓夢》、《全唐詩》正式上網,隨後中研院《廿五史》、《諸子百家》資料庫,台灣大學佛學資料庫上網。網路能傳輸多媒體資訊之後,筆者再將《紅樓夢》以多媒體形式上網。經過短短的五年,現在全球網際網路上由台灣地區研發的中國典籍文獻資料,已有數億字,也具備各種檢索功能,各種媒體資料,呈現一片欣欣向榮的景象。1998年起,由國科會主導的「數位博物館專案先導計畫」〔1〕,邀請中研院等單位進行數位博物館相關計畫,將文獻資料數位化的研發工作,從文字資料擴充到多媒體文獻資料,使用者定位於中小學生,企圖達到往下紮根的目的;1999年進行第二年度的「數位博物館計畫」〔2〕將範圍再次擴充,2000年國科會再次委託中央研究院全面規畫「國家數位典藏計畫」〔3〕,目前正在規畫中,預料可以將文獻數位化的工作進行全方位的研發,中研院並且於2000年舉辦的第三屆國際漢學會議特別增加「漢籍數位典藏研討」議題,專門就「數位化的語文工具」邀請學者發表論文,中國古籍文獻資料數位化的工作,可說是全面有計畫的展開了。
中國古籍文獻數量龐大,在數位化的過程中,輸入方法與中文字碼不足是兩個大問題。中文的輸入、輸出、編輯、排版、全文檢索、編碼等技術,中研院張仲陶教授、謝清俊教授從1980年開始便已指導學生進行中文資訊有關文字問題的研究,奠立了基礎。經過近二十年的努力,文字輸入已有多種不同的工具供使用者選擇,鍵盤輸入之外也發展OCR(optical character recognitio)技術,以滿足龐大的輸入需求。大五碼字種數不足的問題,從早期中研院於開發《廿五史》資料庫時,遇到缺字,逐一造字,以擴大字集的方式解決,到現今中央研究院文獻處理實驗室的「漢字字形資料庫」改用「以部件構字」的觀念,從缺字的輸入、檢索及呈現三方面解決,為解決中文缺字問題,又往前邁進一大步,對於中國古籍文獻數位化的工作貢獻極大。
中國古籍文獻數位化工作的主要目的有典藏、流通、研究、教學四方面,典藏與流通以保存與傳揚文獻為目的,研究與教學期使古文獻為現代人所用;典藏與流通重在管理,研究與教學重在應用,因此,如何設計出符合文史學界使用,使古籍數位化資料成為文史學界教學與研究的輔助工具,以提升其使用效能,成為古籍數位化方向的重要指標。
本文首先嘗試就文史學界與電腦學界對古籍數位化方向的交集與期待,為古籍數位化勾勒出一幅符合使用者需求的藍圖,其次再分述古籍數位化的幾個階段,最後提出未來的展望,以為將來發展的方向與目標。
文史學界與電腦學界對古籍數位化方向的交集與期待
筆者於1987年應《國文天地》編輯的邀請,以〈探一探文史資料自動化的路〉〔4〕為題,訪問電腦界張仲陶教授,文史界周何教授(經部)、毛漢光教授(史部)、王邦雄教授(子部)、王熙元教授(集部)等五位學者,從電腦界、文史界的角度,提出他們對古籍數位化的看法,並從中尋找一條文史資料數位化的路。張仲陶教授首先提出「不要問電腦能做什麼?而是問你要電腦做什麼?」的看法。張教授認為:「平面的資料輸入電腦,出來後還是平面的資料,頂多省去帶書的麻煩而已,我們要讓他具備其他的功能,也就是如何從中摘取需要的資料,這部份由電腦界負責設計程式,但文史界必須告訴我們「需要什麼?」文史界負責提出「需要什麼?」電腦界負責「怎麼滿足需要?」二方面配合起來,就可以做。……我們不希望文史界的人再花時間去學電腦,我們也沒有餘力從頭精研文史。電腦運用的技巧我們知道,但要用在什麼地方,由各行各業,各學門的專家來決定,所以不要問『電腦能做什麼?』而是問『你要電腦做什麼?』這才是關鍵所在。」〔同4〕
文史學界的周師一田教授從經學的角度提出經學
文档评论(0)