- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
摘要
摘 要
Internet的迅速发展引起了网络教育信息数据的海量递增,然而由于网络结构
的庞杂性以及教育信息自身分布的无规律性,信息的获取与应用往往受到限制,因
此如何更高效的获取、利用教育信息成为人们同益关注的问题。对教育信息的分类,
不仅能够为用户检索与使用教育信息资源提供便利,另一方面,通过对相关数据的
分类分析,能够形成对于当前教育软硬件资源分布状况的统计描述,供教育教学人
员、科研工作者以及教育管理者参考使用。
本文通过对国内外相关技术的研究,结合当前应用需求,设计开发了一个用于
教育信息分类的模型。以教育信息中的中小学简介信息为例,首先在分析该类数据
特征项少、权重不均等特点的基础上,以改进的TFIDF算法为提取特征项基本方法,
采用噪声处理、基于模糊集的同义处理等策略构建类别特征库;然后以特征库为依
据,提取并使用模糊规则构建分类算法,实现对教育信息的分类。围绕着模糊规则,
分类模型由特征库与模糊集的建立、文本分析、分类算法实现三个核心环节构成。
为验证分类模型的整体性能,将模糊规则分类与其他分类算法进行对比实验,
实验数据表明:对于教育类信息,以模糊规则为核心构建的分类模型,在分类速度、
分类精度等方面具备优于其他分类算法的性能。这一结论同样适用于篇幅较短、特
征项权重值分布不均衡的文本分类处理。
关键词:TFIDF,模糊规则,分类,模糊集,教育信息
Absnact
AbStraCt
maSs
The ofIntemetcauseS increm锄tof
rapiddeVelopm锄t
ofthe netwo出s仃uc仙re粕dthe
in南mation.HoweV%becauseComplex时of i仃egular
ofeducation ofmeseinf.o肌ation belimited.
dist衲ution info咖ation,theusage always
t0 usethese more
So,tlle how in如姗ation raises
probl锄thatget锄d efl’e嘶Vdy
concenl.ontheone classificationofeducationinf.o册ationc锄
people’s hand,the
ConVeIlieIlcefor and educationinf0肌ationreSources.ontlle
pmVide retneVingusing
and
other theclassification ofreleVant
data,statistical
h锄d,mrough a11alysis des嘶ption
could f.0r
ofcumellteducationresourCec锄be refI盯ence
f.onned,which
文档评论(0)