- 11
- 0
- 约3.84千字
- 约 5页
- 2017-02-09 发布于重庆
- 举报
Web文本分类中的几种阈值策略分析与比较
Web文本分类中的几种阈值策略分析与比较
李子久
摘 要 本文主要针对中文网页,分析比较了文本分类中的关于类别阈值的几种策略,分别是: 位置截尾法(RCut)、比例截尾法(PCut)) (1)
(2)
是类别数量,代表类别,是类别的先验概率,可以通过公式(2)计算得到。
PCut考虑到了全局的分类性能,主要以x为参数,它的值可以通过分类的准确程度来调整,这种确定方法类似于RCut中t值的确定方法。目前,一些分类器,如:贝叶斯、DTree、kNN和LLSF等方法采用了PCut阈值策略[3]。
2.3最优截尾法(SCut)
SCut针对某一类别,计算所有测试文本与该类别的相似度。根据最优化该类别分类器的性能来调整相应的阈值,然后将确定的阈值应用到新的待分类文本上。RCut和PCut阈值策略是平均所有分类器的性能,采用t或x作为参数;而SCut只优化某一类别的性能,并不保证所有类别分类结果达到最优。SCut多被用于Ripper、FOIL、Winnow、EG、kNN、LLSF和Rocchio等分类算法[4]。
2.4改进型截尾法(RTCut)
文献[1]中提出了一种新的阈值策略,即改进型
您可能关注的文档
- WAS使用方法.doc
- Waters高效液相色谱仪标准操作规程.doc
- WAS压力测试使用方法.doc
- WB试验每步原理和技术及试剂的分析.doc
- WATERS高效液相的标准操作规程(SOP).doc
- WCDMACS业务优化掉话问题分析.doc
- WCDMA关键技术.doc
- WCDMA_常见问题的分析思路和方法的总结.doc
- WAS配置应用使用新的虚拟主机.doc
- WCF大数据量传输解决方案.doc
- 2026年山东理工职业学院单招职业适应性考试题库及参考答案详解一套.docx
- 2026年智能交通行业投资布局与发展报告.docx
- 2026年产业用纺织品十年工业过滤技术报告.docx
- 2026年山东理工职业学院单招职业适应性测试题库附答案详解.docx
- 2026年生物打印肝脏细胞修复行业趋势.docx
- 2026年医院LIS系统管理工作计划.docx
- 2026年山东电子职业技术学院单招综合素质考试题库及参考答案详解1套.docx
- 量子加密市场五年预测:量子科技资管投资报告2026年.docx
- 2025-2026学年小学音乐一年级下册接力版(2024)教学设计合集.docx
- 2025年辽宁省大连市中考数学二模试卷.docx
最近下载
- 2026年贵州省公安厅招聘警务辅助人员笔试试题(含答案).docx VIP
- 完整版圆锥曲线的切线方程的推导.doc VIP
- 最新人教版高中英语必修一综合测试题全套及答案.docx VIP
- 采用进端热处理技术悬链式CCV生产线生产220kV及以上超高压.PDF
- 新视野大学英语第三版读写教程第二册课后题答案(完整版).pdf VIP
- 气胸胸腔闭式引流规范.docx VIP
- 脓胸诊疗与引流冲洗规范.ppt
- 2025年中考化学一轮复习资料-重难点突破01 溶解度及溶解度曲线(讲义)(原卷版).docx VIP
- 鲲鹏认证-HCIP-Computing-H13-221题库.doc
- 检验机构质量管理流程文件清单.docx VIP
原创力文档

文档评论(0)