- 15
- 0
- 约3.06千字
- 约 6页
- 2022-04-25 发布于北京
- 举报
PAGE
1 -
基于改进K最近邻算法的中文文本分类
基于改良K最近邻算法的中文文本分类
5137〔2021〕01-0096-06
Abstract:Thispaperfocusesonthehighdimensionaltextproblemsencounteredintextclassification.Documentfrequency〔DF〕-chisquarestatisticfeatureextractionmethodisproposedtoreducethefeatureitemsandreducethedimensionoftext.BasedontheKNearestNeighbor〔KNN〕algorithm,inviewoftheproblemthattexttobeclassifiedshouldbecalculatedinsimilaritywithalargenumberoftrainingsetsamples,aKNNalgorithmbasedongroupingcentervectorisproposed.Thecentervectorsofeachgroupwereobtainedbygroupingthesamplesetsinthecategory,soastoimprovetheclassificationperformanc
您可能关注的文档
- 化工安全设计中的危险因素及应对措施分析.docx
- 化工安全生产、治理工作研究.docx
- 基于风险观的综合机械化和机电一体化在煤矿开采中应用分析.docx
- 基于风险治理的高校内部操纵进展建议.docx
- 基于风险治理视角探析公立医院内部操纵问题.docx
- 基于伏安特性方程的CMOS数字电路电压传输特性研究.docx
- 基于辅导员视角的大学生网贷问题及抵制教育.docx
- 基于复变函数的混合型大数据多源集成系统设计.docx
- 基于改进CART算法的降雨量预测模型.docx
- 基于改进TOPSIS法的PPP项目风险初步分担研究.docx
- 屠宰生猪安全生产制度.docx
- 2026年社区残疾人帮扶方案.docx
- 2026低分子肝素临床应用中国专家共识解读课件.pptx
- 食品小作坊监管问卷.docx
- 施工防寒保暖保障实施计划.docx
- 文职秘书类(建筑公司)中建三局工程总承包公司办公室秘书岗位职责说明书.docx
- 2025-2026学年四年级语文下册学情自测卷(4+月)(统编版).docx
- Unit+5+Helping+our+parents+(Cartoon+time+&+Checkout+time+)(课件)-五年级英语下学期同步精品课堂(译林版三起).pptx
- 总复习+分数的意义和性质(课件)-2024-2025学年五年级下册数学人教版1.pptx
- 图形的位置(课件)-2025-2026学年+-2025-2026学年六年级下册数学+人教版.pptx
原创力文档

文档评论(0)