知网语义标注手册.DOC

PAGE 1 基 於 知 網 的 常 識 知 識 標 注 General Knowledge Annotation Based on How-net 顏 國 偉 香 港 科 技 大 學 計 算 机 科 學 系 gankw@cs.ust.hk 譚 慧 敏 新 加 坡 南 洋 理 工 大 學 中 華 語 言 文 化 中 心 CLWMTham@.sg Gan Kok Wee Department of Computer Science Hong Kong University of Science Technology Clear Water Bay Road, Kowloon, Hong Kong gankw@cs.ust.hk Tham Wai Mun Centre of Chinese Language and Culture Nanyang Technological University Singapore CLWMTham@.sg 基 於 知 網 的 常 識 知 識 標 注 General Knowledge Annotation Based on How-net 摘 要 知 網 是 個 雙 語 的 常 識 知 識 庫 , 描 述 概 念 與 概 念 之 間 種 種 不 同 的 關 係 , 包 括 上 下 位 關 係 、 近 義 關 係 、 反 義 關 係 、 部 件 與 整 體 間 的 關 係 、 屬 性 與 宿 主 之 間 的 關 係 、 材 料 與 成 品 之 間 的 關 係 、 對 逆 關 係 、 動 態 角 色 關 係 和 概 念 同 現 關 係 。 本 文 利 用 知 網 標 注 了 三 萬 目 詞 的 語 料 。 我 們 的 語 料 來 自 中 央 研 究 院 平 衡 語 料 庫 ( 第 三 版 ) 中 有 關 社 會 犯 罪 的 報 章 報 導 。 玆 將 標 注 方 法 以 及 標 注 過 程 中 所 發 現 的 問 題 和 我 們 的 解 決 方 案 摘 要 報 告 。 Abstract How-net is a bilingual general knowledge-base describing relations between concepts and relations between the attributes of concepts. It covers over 62,000 concepts in the Chinese language and close to 73,000 English equivalents. The relations include hyponymy, synonymy, antonymy, meronymy, attribute-host, material-product, converse, dynamic role, and concept co-occurrence. The philosophy behind the design of How-net is its ontological view that all physical and non-physical matters undergo a continual process of motion and change in a specific space and time. The motion and change is usually reflected by a change in state that in turn, is manisfested by a change in the value of some attributes. The top-most level of classification in How-net thus includes: Entity, Event, Attribute, and Attribute Value. It adopts a bottom-up approach in deriving a total of over 1400 sememes. These sememes are extracted from about 6000 Chinese characters. They are organized hierarchically and their robustness is carefully evaluated by checking their adequacy in describing over 62,000 concepts in Chinese. The experiment c

文档评论(0)

1亿VIP精品文档

相关文档