- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
诠释资料-成功大学myweb个人网页空间服务说明
詮釋資料(meta-data)
一、概論
詮釋資料是「描述其他資料的資料」(data about data)。它是一個資料庫,紀錄相關資料的基本資料。例如,圖書館的「圖書資料庫系統」便是一種詮釋資料(庫),它紀錄了圖書館內所有圖書的書名、作者、出版者、…等相關資料。每一本書的目錄也是一種詮釋資料,它描述了各章節(資料)的標題。
詮釋資料庫通常搭配「檢索系統」,供人很容易找到所需的資料。
詮釋資料庫涉及許多專業領域知識,目前多只能以人工方式摘錄。
待發展的技術:
結合CBR,以「相似性」(含「空間近鄰性」)之方式查詢。
可結合「全文檢索」。
配合蒐尋引擎,及知識探掘技術(data mining),自動理解網頁內容,自動更新詮釋資料內容。
結合資料倉儲技術,自動供應資料。
結合專家知識地圖,正確排序推荐網站。
以XML為標準語言,跨領域、跨詮釋資料庫查詢。
軟體工程的系統分析結果,會產生「資料典」(data dictionary),可以說是在系統分析階段的詮釋資料。此時,詮釋資料庫裡的資料可能是不存在的。
一般而言,詮釋資料(庫)是指涉真正存在之資料。
二、相關研究
應用領域
目前至少已有20種以上屬國際標準或逐漸形成標準的Metadata格式存在於各學科領域,Lorcan Dempsey等人曾依Metadata格式的繁簡度及特質概分為三大群組:
1、第一組:簡單格式(simple formats)
此類多是由某公司獨家製造與專屬。係全文式索引網路資源(例如:Lycos、Altavista、Yahoo等),通常由機器自動擷取資源後直接索引並提供檢索。
2、第二組 結構化格式(structured formats)
此類係正在標準化中的格式,以欄位為架構來索引相關資源。例如,Dublin Core、IAFA templates、RFC1807、SOIF、LDIF等。它們所含括的描述資料基本上足以讓使用者找出有興趣之相關資源。這類型格式以簡單的設計為原則,未受專門訓練的資料提供者也能容易上手建立Metadata記錄。但是相對地,格式的設計上較缺乏物件或資源間不同層次的關聯性功能。
3、第三組:複雜格式(rich formats)
此類為已符合國際標準的格式,以詳細的標誌(elaborate tagging)來呈現資源的內涵。例如:ICPSR(Inter-university Consortium for Political and Social Research)、CIMI(Computer Interchange of Museum Information)、EAD(Encoding Archival Description)、TEI(Text Encoding Initiative)、MARC等。這類型的格式通常需由研究學者或具專門知識者來描述資源的內涵。
在國內,臺大陳雪華教授將Metadata依主題歸納為八大類:
1、早已普遍使用的格式
2、描述科技文獻
3、描述人文及社會科學資源
4、描述政府資訊
◎ GILS (Government Information Locator Service)
5、描述地理空間性資源
◎ FGDC (Federal Geographic Data Committee)
6、描述博物館藏品與檔案特藏
7、描述大量網路資源
◎ Dublin Core(Dublin Metadata Core Element Set)
◎ IAFA/WHOIS++ Templates(Internet Anonymous FTP Archive)
◎ LDIF(LDAP Data Interchange format)
◎ SOIF(Summary Object Interchange Format)
◎ URCs(Uniform Resource Characteristics/Citations)
8、其他
(二)都柏林核心集Dublin Core Metadata Initiative (DCMI)
針對網路資源屬性所使用的詮釋資料格式。
原始網站: HYPERLINK / /
中文翻譯對照網站: HYPERLINK .tw/dublin/ .tw/dublin/
Dublin Core的格式欄位:
The Elements
Element Name: Title
Element Name: Creator
Element Name: Subject
Element Name: Description
Element Name: Publisher
Element Name: Contributor
Element Name: Date
Element Nam
文档评论(0)