- 17
- 0
- 约1.38万字
- 约 5页
- 2016-02-02 发布于天津
- 举报
基于类别的CHI特征选择方法.pdf
安徽广播电视大学学报 2015年第3期
基于类别的CHI特征选择方法
梁伍七, 李 斌, 许 磊
(安徽广播 电视大学 信息与工程学院,合肥 230022)
摘 要:文本分类问题中,卡方特征选择是一种效果较好的特征选择方法。计算单词的卡方值时,先计算单
词针对每个类别的卡方值,再通过类别概率将卡方值调和平均,作为单词相对于整个训练集合的卡
方值,这种全局方法忽视了单词和类别间的相关性。针对这一问题,提出基于类别的卡方特征选择
方法。基于类别的方法针对每个类别遴选特征词,特征词数量根据事先设定的阈值、类别的文档数
和整个训练集合文档数计算得到,不同类别的特征空间可能包含相同的特征词。采用 KNN分类方
法,将基于类别的方法与全局方法进行比较 ,实验结果表明,基于类别的方法能够提高分类器的总体
性能。
关键词 :文本分类;卡方;特征选择;特征词 ;KNN分类
中图分类号 :TP391 文献标识码:A 文章编
您可能关注的文档
- 基于标签相关性的K近邻多标签分类方法.pdf
- 基于格兰杰因果关系贝叶斯网络的大规模无线局域网流量预测方法.pdf
- 基于概率相关性的多标签数据流变化检测.pdf
- 基于模糊聚类模型的葡萄酒分类.pdf
- 基于模糊关联规则和决策树的图像自动标注.pdf
- 基于比亚迪混合动力汽车秦的新能源汽车财政政策研究.pdf
- 基于活动的出行生成预测方法.pdf
- 基于消费者认知的新产品品牌设计模式研究.pdf
- 基于深度包解析的信息系统性能监测分析方法.pdf
- 基于混沌神经网络的混合动力汽车状态切换协调控制策略研究.pdf
- 2026住宅小区消防改造建筑方案(执行版,含总平面布置/疏散流线/消防节点).docx
- 2026制造工厂人力资源规划与排班配置方案(执行版,含排班模型/岗位编制/缺口清单).docx
- 2026人工智能企业内训实施计划(执行版,含培训安排/案例任务/考核清单).docx
- 2026仓储物流园总平面布置建筑方案(执行版,含车流组织/仓位分区/消防间距).docx
- 2026老旧办公楼节能改造建筑方案(执行版,含围护结构/节能设备/施工节点).docx
- 2026Python文件批量重命名与归档脚本方案(执行版,含文件样例/处理脚本/归档规则).docx
- 2026企业会计准则长期股权投资核算指南(执行版,含成本法分录/权益法分录/减值检查表).docx
- 2026社区养老服务中心项目可行性研究报告(执行版,含服务需求/建设内容/运营预算).docx
- 2026物流园冷链仓储项目可行性研究报告(执行版,含选址分析/设备配置/财务测算).docx
- 2026企业会计准则现金流量表编制口径手册(执行版,含分类口径/填报模板/勾稽检查表).docx
最近下载
- 电气装置安装工程-低压电器施工及验收规范GB50254.doc VIP
- (正式版)DB3309∕T 83-2021 《海底电力电缆线路安全管理规范》.docx VIP
- 家具厂项目突发环境事件应急预案.pdf
- 雯雯三村落难记叙.pdf VIP
- DG_TJ08-2458-2024工程结构健康监测技术标准.pdf VIP
- 2025-2026学年中职英语基础模块 2外研版(2021)教学设计合集.docx
- 基于单片机的智能小车的设计与实现.doc VIP
- DB37T 5331-2025工程结构健康监测技术规程.pdf VIP
- 《管理统计学 第2版》课后参考答案 雷怀英.pdf
- 深筋膜徒手松解疗法.docx VIP
原创力文档

文档评论(0)