- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
索引典及其於资讯检索上之探讨-LIPS语言资讯处理系统实验室
索引典及其於資訊檢索上之探討張嘉彬【臺大圖書館學研究所研究生】
書苑季刊36期第46-59頁 【摘要】
近年來是一個讀者至上的時代,因此在資料庫中允許用自然語言檢索已經成為一個未來系統設計的重要趨勢。但是利用自然語言檢索仍然有一些缺失存在,因此在控制詞彙上是相當重要的一環,但是圖書資訊界人士對於它似乎既熟悉又陌生。因此,本文首先先對索引典做一簡單介紹,而後探討它在資訊檢索上之應用,最後說明索引典在資訊檢索上之發展趨勢。
關鍵詞:索引典、資訊檢索
一、前言
近年來是一個讀者至上的時代,因此在資料庫中允許用自然語言(Natural Language)檢索已經成為未來一個系統設計的重要趨勢。讀者只要將心中所想要找的資料鍵入資料庫中,就能夠找尋到所需要的資訊,而不用再去找一些像標題表或者是索引典這樣的規範工具,因為這是最符合讀者資訊需求的方式。但是利用自然語言進行檢索仍然有一些缺失存在,諸如:沒有辦法控制同義詞、類同義詞、同形異義詞,再加上詞彙本身的模糊性以及不確定性,因此控制詞彙(Controlled Vocabulary)檢索在資訊檢索上仍有它不可磨滅的重要性。
索引典在控制詞彙上是相當重要的一環,並且它在資訊檢索中是扮演著檢索系統與讀者在溝通上的一個橋樑。索引典在圖書資訊界是一個普遍使用的名詞,但是圖書資訊界人士對於它好像既熟悉又陌生,因此,本文首先就索引典做一簡單的介紹,而後探討它在資訊檢索上之應用,最後說明索引典在資訊檢索中之發展趨勢。
二、索引典簡介
(一)索引典之定義 索引典的英文是“thesaurus”本意是倉庫、寶藏或金庫的意思,後來被認為是一種專門蒐集同義詞與反義詞的詞典。應用於資訊檢索方面最早是由穆爾期(Mooers)於1947年到1950年間所提出的描述語、資訊檢索與資訊檢索系統等專門術語。1957年布郎森(Brownson)第一次正式使用索引典這個術語,他認為解決資訊檢索問題的最佳答案,是應用機械化的索引典。(註1)所以,索引典自1950年代開始逐漸發展,而至今已廣泛應用於資訊檢索系統,但是究竟什麼是索引典呢﹖關於索引典的定義,以下引用幾個常見的定義以資參考:
索引典可以以其功能或結構定義之。就功能而言,索引典是一種控制詞彙的工具,其用途是將文獻、索引人員或系統使用者所使用的自然語言,轉譯成更為規範的「系統語言」(文獻工作語言、資訊語言)。就結構而言,索引典是一部含有特定知識領域的詞彙,詞彙間有語義或從屬上的關係,且詞彙是控制的、動態的。(註2)
索引典是索引者和檢索者選擇術語的依據,可供索引者和檢索者對索引用語做有系統的指示與控制,再利用這些字彙做概念的組合,它除了引導使用者自行選用術語之外,並對其相關字和同義字做詳細的互見參考,所以它是字彙控制最有效的工具。(註3)
索引典可以當成人類思路歷程的類比……索引典的結構最好和人類大腦的構造一樣,當有一概念產生時,人們可以在自己的思路中尋找最適合的詞彙來表達。(註4)
綜合上面定義所言,就資訊儲存與檢索的範疇而言,索引典乃收集足以表示知識概念的字或詞,並將之以特定的結構加以排列,這些詞彙控制了同義詞,區別了同形異義詞,並顯現各相關詞彙間階層及語意互屬上的各種關係,以做為索引者在分析處理資料及讀者在檢索資料時能選用一致的、經過控制的詞彙。換言之,即提供資訊儲存與檢索標準化的用語。(註5)
(二)索引典之目的 索引典之目的主要有如下幾個,分別說明之。(註6)(註7)
在特定的知識領域,提供概念之間的關係指引,幫助索引人員(indexer)及檢索人員(searcher)了解該學科的知識架構。使用者並可藉著詞間關係,由已了解的知識概念來了解新概念的涵意。
在特定的知識領域,提供索引人員一套標準化詞彙,確保資料索引的一致性。
為了確保資料處理的一致性,索引典為一概念一詞彙,而其他同義詞則以用代關係指引。
詞與詞之間有明確的詞間關係存在,這些關係能區分各詞在詞義網架構中的功能,可做為使用選擇正確詞彙的指引。
當查出的資料太多或太少時,索引典的層級結構可幫助使用者擴大或縮小檢索主題旳詞彙範圍。
最好能成為該學科的標準用語。
(三)索引典之功能 不論是索引人員分析資料或是檢索人員查找資料,都先分析出主題概念,找出主題詞,而索引典則幫助他們將主題詞由自然語言轉為系統語言,因此索引典就是建立一套使用者(包括索引人員、檢索人員、讀者)彼此了解可藉以溝通的系統語言,為資訊的儲存與檢索提供標準化的詞彙,以確保對同一主題,在分析及檢索資料時所用的詞彙一致。
D.Soergel則認為索引典的概念結構(conceptual structure)在索引及檢索時能將主題概念表現得恰到好處,而索引典將同義詞聚集亦有詞彙控制(ter
文档评论(0)