- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
年度文本分类评测大纲一评测对象本次评测的对象是文本分类系统中的核心技术二评测内容本次评测主要评测文本分类系统对文本进行分类的准确性和全面性三评测方法评测方式本次评测为现场测试采取自动评测的方式进行训练语料将提前个月公布评测步骤在评测单位统一提供的评测环境上安装被测系统评测单位给出若干篇测试文章被测单位运行文本分类系统并将输出的分类交给评测单位评测单位事后组织专家进行评测并公布评测结果评测标准分类标准本次评测的分类标准采用中国图书馆图书分类法第四版具体方案请参见附录由于工业技术和综合性图书这两类难
2004年度文本分类评测大纲
一、评测对象
本次评测的对象是文本分类系统中的核心技术。
二、评测内容
本次评测主要评测文本分类系统对文本进行分类的准确性和全面性。
三、评测方法
1.评测方式
本次评测为现场测试,采取自动评测的方式进行。训练语料将提前1个月公布。
2.评测步骤
在评测单位统一提供的评测环境上安装被测系统;
评测单位给出若干篇测试文章;
被测单位运行文本分类系统,并将输出的分类交给评测单位;
评测单位事后组织专家进行评测,并公布评测结果。
3.评测标准
(1)分类标准
本次评测的分类标准采用《中国图书馆图书分类法》(第四版),具体方案请参见附录。由于“T 工业技术”和“Z 综合性图书”这两类难以判定,因此不予考虑,故实际总的分类数为36类。
此次评测规定对每个给定的测试文本最多产生两个结果类别,结果按照相关性的大小,由大到小进行排列;准确率、召回率以及F1值以及它们的宏平均值和微平均值均仅针对于分类结果中的第一个结果。
(2)量化指标
第j类的准确率(Pj):准确率是所有输入系统进行分类处理的文本中与专家分类结果完全吻合的文本所占的比率,其数学公式表示如下:
其中 lj 为第j类分类正确的文本数,而 mj 为分类系统实际分类为j的文本数。
第j类的召回率(Rj):召回率是应有文本中分类系统分类正确的文本所占的比率,其数学公式表示如下:
其中 lj 为第j类分类正确的文本数,而 nj 为专家分类为j的文本数。
第j类的F1值(F1j):也称之为综合分类率,其数学公式如下:
其中Pj为第j类的准确率,Rj为第j类的召回率。
宏平均准确率
其中Pj为第j类的准确率,n为专家分类的总数。
宏平均召回率
其中Rj为第j类的召回率,n为专家分类的总数。
宏平均F1值
其中MacroP为宏平均准确率,MacroR为宏平均召回率。
微平均准确率
其中lj 为第j类分类正确的文本数,mj 为分类系统实际分类为j的文本数,n为专家分类的总数。
微平均召回率
其中 lj 为第j类分类正确的文本数, nj 为专家分类为j的文本数,n为专家分类的总数。
微平均F1值
其中MicroP为微平均准确率,MicroR为微平均召回率。
分类器综合得分(Score)
专家分类
分类器分类
Scorej
A
A
1
A,X
0.75
X,A
0.5
X
0
X,Y
0
A,B
A,B
1
A,X
0.75
A
0.75
B,A
0.75
B,X
0.5
B
0.5
X,A
0.5
X,B
0.3
X,Y
0
X
0
其中,A代表专家分类的第一个类,B代表专家分类的第二个类,X、Y代表分类器产生的错误分类。
分类器的综合得分,其中n为评测文件总数。
(3)评判依据
文本分类系统的最终评判由宏平均F1值、微平均F1值和分类器综合得分得出。系统完成分类所用时间也作为参考指标。
4.输入输出文件格式
输入输出文件都以XML格式给出。
(1) 输入文件格式
ATC type = “文本分类文件列表”
doc id = “1”dir1/file1.txt/doc
doc id = “2”dir1/file2.txt/doc
doc id = “3”dir2/file3.txt/doc
……
doc id = “n”dirm/filen.txt/doc
/ATC
其中每个doc对应一篇文章。
(2) 输出文件格式
ATC type = “文本分类结果列表”
result id = “1”
class id = “1”G 文化、科学、教育、体育/class
class id = “2”R 医药、卫生/class
/result
result id = “2”
class id = “1”TP 自动化技术、计算技术/class
/result
……
result id = “n”
class id = “1”X 环境科学、劳动保护科学(安全科学)/class
/result
/ATC
注意:
输出文件中的类别中的汉字主要是为了方便人工校对,自动评测程序进行评测时,以英文类别名为准。例:class id = “1”G 文化、科学、教育、体育/class,则自动评测程序仅提取“G”作为类别,“文化、科学、教育、体育”作为参考。
无论输入文件还是输出文件中,“=”的两旁都必须各有一个空格。
无论输入文件还是输出文件中,引号均为半角。
四、评测环境
本次评测环境包括:操作系统为Windows2000,硬件配置不低于:P4 1GHz,256M内存,40G IDE硬盘。
?附录
中国图书馆图书分类法简表
A 马列主义、毛泽东
您可能关注的文档
- 2006年石油工业标准制修订计划.doc
- 2007年大兴区科技发展计划项目立项公告.doc
- 2008年一季度工作情况-顺德区人民检察院.doc
- 2009中国经皮冠状动脉介入治疗指南PCI术的药物治疗.ppt
- 2010全球哮喘处理和预防策略.ppt
- 2010年农作物病虫害生态控制技术培训班-商务部培训中心.doc
- 2010年水稻高产创建技术规范模式图.doc
- 2011中外护理差异与应对.ppt
- 2012年3月份中层干部值班安排表.doc
- 2012年厦门大学福建大学生创新创业训练计划项目.doc
- 个人承诺书 15篇完整版 .pdf
- 部编版道德与法治三年级下册《1我是独特的》(省一等奖优质课)教案.pdf
- 部编人教版四年级语文下册.第六单元《乡村生活》作文范文 .pdf
- 数控技术应用专业(中职)人才培养方案 .pdf
- 2023年4月陕西咸阳市2023届高三三模英语试题卷(含答案word精校版).pdf
- 2024年高考语文作文热点预测+满分范文 .pdf
- 2023武汉市硚口区事业单位考试历年真题 .pdf
- 北京市朝阳区2013年事业单位《公共基本能力测验》(缺单选16-45题,72.pdf
- 社区社会工作基础知识试题(含答案)vr .pdf
- 2021康复医学治疗技术(士)模拟试题及答案5篇 .pdf
文档评论(0)