知网最新进展.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
通告: 敬爱的知网用户: 我们计划为您更新知网数据。请您自2010年5月1日至6月1日期间,与 support@ 联系,确认您的联系人。 知网新闻: 自2008年末至今,特别是近5个月来,知网有了很大的发展。 1. 基础数据的更新 a. 为英语词语增加了丰富的词法和句法信息,以满足英语分析和英汉机器翻译研发的需要。其中例如:名词的单复数词尾变化,形容词和副词的比较级与最高级变化,动词的系动词、及物与不及物以及相应的句型等等。 b. 全面的一致性检查和修正。它是在程序的辅助下,最后由人工校订的。 c. 增加中英文词语,最新词语如“低碳”、“宅度假”等。知网基础数据规模现今如下: 中文词语条目 100168 英文词语条目 96370 中文义项 114985 英文义项 121042 概念定义 29868 总记录 191924 2. 完成“中文歧义结构判别系统之一 – VXY (Disambiguator of Chinese Syntactic Structures -- VXY)”。它可以判别中文里的一种极为常见的歧义结构(V+N/V/A+的N/V)。用户可以访问: 对该系统进行测试。 3. 完成“知网推理机 (HowNet Inference Machine)”。此系统为“意义群落测定系统”的基础,它包含下列两部分: a. “意义群落构建 (Sense Colony Construction)”。它是一个用以建造“意义群落”的软件。它的特点是:基于规则的,因此是可以由用户根据自己的需要来定制的。图1为软件的界面。 b. “意义群落 (Sense Colonies )”。它包含了基于知网中近30000概念的相关概念的集群。它是意义群落测定的依据。 4. 完成“意义群落测定系统 (System of Sense Colony Testing )”。它有效地应用于文本聚类、文本分类、信息过滤、歧义判别等。该系统的界面图2和3显示:在判别中文词“好日子”的三个义项中的结果。 5. 完成“基于知网的英汉机译系统Beta版 (HowNet-based English-Chinese MT System , Beta version)”。它直接采用知网作为它的基础数据,因此具有极强的语义功能。它是基于规则的,它的英汉语言转换平面,直接利用知网规定的语义角色。 图 1 图 2 图 3

文档评论(0)

136****3783 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档