- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于词典和We的词汇关系抽取
基于词典和Web 的词汇关系抽取
范庆虎 昝红英 张坤丽 贾玉祥
郑州大学信息工程学院,河南 郑州 450001
Email:fanqinghude@163.com {iehyzan, ieklzhang, ieyxjia}@
摘要 郑州大学参加了NLPCC2012 中的词汇语义关系的任务,该任务包括两个子任务,子任务1 是同义
词抽取,采用中文概念词典、同义词词林等词典并且结合百度百科、有道翻译等Web 方式进行抽取,子任
务2 是下位词抽取,采用中文概念词典并且结合百度百科标签、互动百科、维基百科等Web 方式进行抽取。
两个子任务均采用词典和基于Web 的方法。其中子任务1 提交的结果宏平均F1 值取得了第二名,微平均
F1 值取得了第三名;任务2 提交的结果宏平均F1 值取得了第一名,微平均F1 值取得了第二名,子任务1
和子任务2 的所有召回率均取得了第一名。
关键词 同义词;下位词;词汇关系;基于词典;基于Web
Lexical Reiteration Extraction Based on Dictionary and Web
FAN Qinghu,ZAN Hongying,ZHANG Kunli ,JIA Yuxiang
School of Information Engineering Zhengzhou University,Zhengzhou,Henan 450001
Email:fanqinghude@163.com {iehyzan,ieklzhang,ieyxjia}@
Abstract Zhengzhou university had taken part in the task of NLPCC 2012. The task contains two sub-tasks.
The sub-task one was synonym extraction. The method of the sub-task one that was based on dictionary that
contains Chinese Concept Dictionary, Tongyici Cilin (Extended) and combined with the Web that contains Baidu
Encyclopedia,Hudong Encyclopedia and Youdao translation. The method of the sub-task two that was based on
Chinese Concept Dictionary and combined with Web that contains Baidu Encyclopedia Tag,Hudong Encyclopedia
and Wikipedia. The macro-average of F1 value of the evaluation values of the sub-task one achieved the second,
the micro-average of F1 value of sub-task one reached the third. The macro-average of F1 value of the evaluation
values of the sub-task two reached the first, the micro-average of F1 value reached the second. Both the sub-task
one and the sub-task two with Recall rate reached the first.
Key words synonym; hyponym; lexical reiteration; based on dictionary; based on Web
1 评测介绍
2012 年第一届自然语言处理与中文计算会议评测共设置2 个任务。其中,任务1 是面
向中文微博的情感分析,任务2 是中文词汇语义关系抽取。任务2 中包括两个子任务(同义
词发现和下位词发现)。下面对两个子任务的实现方法和实验过程做以详细介绍。
2 实现方法
2.1 同义词发现
同义词,指表达的意义相同或相近但表达形式不同的词汇。主要
您可能关注的文档
最近下载
- 《机械装调技术》电子教案 模块五 整机调试与运行任务一 齿轮啮合齿侧间隙的检测与调整.doc VIP
- 青花瓷 完美演奏版 周杰伦 钢琴谱 数字 简谱.pdf VIP
- 第38届物理竞赛决赛实验考试答题纸 .pdf VIP
- 现代医药物流交易的配送中心建设项目可行性研究报告.doc VIP
- 2025-2026学年初中生物学人教版2024八年级上册-人教版2024教学设计合集.docx
- 养生馆卫生管理制度(3篇).docx
- 健康管理师课件第一章--健康管理概论.ppt VIP
- JBT 4333.4-2013 厢式压滤机和板框压滤机 第4部分:隔膜滤板.pdf VIP
- 电信反诈骗演讲稿模板5篇.docx VIP
- 基于光纤布拉格光栅的温度测量系统设计与应用.docx VIP
文档评论(0)