词汇语义关系评测.pptVIP

  • 3
  • 0
  • 约2.61千字
  • 约 15页
  • 2017-02-16 发布于湖北
  • 举报
词汇语义关系评测 吴云芳 万富强 周蜜 北京大学计算语言学研究所 wuyf@pku.edu.cn 2012-12-2 纲要 任务描述 评测数据的准备 评测数据的标注 参赛系统的结果 存在问题 进一步工作展望 缘起 词汇语义信息是自然语言处理中很重要的资源,是进一步进行句法和语义分析的基础。 在信息检索中的查询扩展、机器翻译中的模块识别等方面,相似词都是不可或缺的知识资源; 在句法分析、词义消歧等信息处理任务中,词语相似度也发挥着重要的作用。 而相似度词典的手工构建是一项费时费力的浩大工程,存在着不易更新、覆盖度不全等诸多缺陷。 任务描述 任务一:同义词发现 文件 文书 文本 文牍 公文 文献 档案 文档 任务二:下位词发现 算法 分治法 动态规划法 贪心法 回溯法 同义词词语的选词范围 来源 类型 目标词数 QQ 聊天语料 口语词语 173 领域同义词库 常用词语 1585 微博 新词语 73 Gigaword 名词 5000 Gigaword 动词 2000 Gigaword 形容词 1000 Gigaword 成语 50 人民日报语料 组织机构名 50 人民日报语料 地名 50 维基百科 人名 50 去重之后得到 9464 个同义词词语。 下位词词语的选词范围 来源 类型 目标词数 《现代汉语语义词典》 语义类标签 44 《现代汉语词典》 上位词 (“是

文档评论(0)

1亿VIP精品文档

相关文档