- 3
- 0
- 约2.61千字
- 约 15页
- 2017-02-16 发布于湖北
- 举报
词汇语义关系评测 吴云芳 万富强 周蜜 北京大学计算语言学研究所 wuyf@pku.edu.cn 2012-12-2 纲要 任务描述 评测数据的准备 评测数据的标注 参赛系统的结果 存在问题 进一步工作展望 缘起 词汇语义信息是自然语言处理中很重要的资源,是进一步进行句法和语义分析的基础。 在信息检索中的查询扩展、机器翻译中的模块识别等方面,相似词都是不可或缺的知识资源; 在句法分析、词义消歧等信息处理任务中,词语相似度也发挥着重要的作用。 而相似度词典的手工构建是一项费时费力的浩大工程,存在着不易更新、覆盖度不全等诸多缺陷。 任务描述 任务一:同义词发现文件 文书 文本 文牍 公文 文献 档案 文档 任务二:下位词发现 算法 分治法 动态规划法 贪心法 回溯法 同义词词语的选词范围 来源 类型 目标词数 QQ 聊天语料 口语词语 173 领域同义词库 常用词语 1585 微博 新词语 73 Gigaword 名词 5000 Gigaword 动词 2000 Gigaword 形容词 1000 Gigaword 成语 50 人民日报语料 组织机构名 50 人民日报语料 地名 50 维基百科 人名 50 去重之后得到 9464 个同义词词语。 下位词词语的选词范围 来源 类型 目标词数 《现代汉语语义词典》 语义类标签 44 《现代汉语词典》 上位词 (“是
您可能关注的文档
最近下载
- 300Mvar双水内冷调相机安装技术交底.pptx VIP
- 国家建筑标准设计图集20S515 钢筋混凝土及砖砌排水检查井.pdf VIP
- DB简易升降机安全技术规范.pdf VIP
- 学生学籍信息管理规范流程手册.docx VIP
- 《认识天气预报》幼儿园中班科学PPT课件.ppt VIP
- 2026年广东深圳市高三二模高考化学模拟试卷(含答案详解).pdf VIP
- 2025年江苏省启东市事业单位公开招聘考试职业能力倾向测验(D类)(中小学教师类)真题及参考答案.docx
- SCS-500E__V1[1].120130812 说明书系列 说明书系列.pdf VIP
- 2025《换热器的结构设计与强度计算过程案例》2900字.docx
- 毕业设计(论文)-苹果采摘机构末端执行器设计.docx
原创力文档

文档评论(0)