《宋会要》系统简介.PDFVIP

  • 11
  • 0
  • 约8.41千字
  • 约 26页
  • 2017-06-22 发布于安徽
  • 举报
《宋會要》系統簡介 (SongHuiYao v0.89.002) This presentation introduces the discovery system for the Song huiyao, developed at the Center for Research on Digital Humanities, National Taiwan University, with permission from the Institute of History, Academia Sinica, and the China Biographical Database project. The Song huiyao discovery system will continue to be developed while open to users. 杜協昌 2012-03-02 Tu Hsieh-Chang author and developer; English notes by P.K. Bol 1 資料來源The data as received after CBDB processing of the original XML file from IHP •  九月間 ,從哈佛大學取得已切分為條目的Excel 檔 –  共80396 筆條目 ,放置於5 個檔案中 –  前三個欄位為「帝系」、 「職官」 、「食貨」等類別訊息 –  接下來的三個欄位為「天禧元年」、 「正月」、 「九日」等日期資訊 –  第七個欄位為全文內容(內含已去除標籤的標注資訊) –  The complete text of the SHY is in column G; it has not been altered. 2 其他資料來源making use of the Dharma Drum chronology, CBDB code tables, and text mining procedures to identify possible person names •  法鼓山DDBC Chinese Calendar database –  中西曆日期轉換 •  CBDB (中國歷代人物傳記資料庫)詞彙 –  宋代人名35632 筆 (原40738 筆 ,扣除明顯的雜訊後 剩下35632 筆 ;其中有9470 筆出現於 《宋會要》) –  宋代官名5815 筆 (其中有3366 筆出現於 《宋會要》) –  宋代地名4010 筆 (其中有2420 筆出現於 《宋會重覆 與要》) •  利用文本採礦(text mining) 從全文擷取出 –  可能的人名 11901 筆 (粗估約33% 正確率) 3 系統功能概要Functions: •  查找文件full text search, faceted search –  全文檢索 :查找內容有出現指定字詞的文件 –  後分類 :從查詢結果 ,利用「年代」、 「類別」等來縮 小搜尋範圍 •  人物生平資訊(取自CBDB)biography display •  詞頻(人名、地名 、官名)分析term-list based analysis •  文件集在年代的分佈與比較temporal distributions •  儲存自訂的文件集 ,方便日後調閱saving selections •  使用者回饋機制user feedback mechanism •  前後綴詞工具context

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档