- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《基于文本内容的敏感词决策树信息过滤算法》.pdf
第 40卷 第 9期 计 算 机 工 程 2014年 9月
Vo1.40 No.9 ComputerEngineering September2014
· 开发研究与工程应用 · 文章编号:1000-3428(2014)09-0300-05 文献标识码:A 中图分类号:TP393
基于文本 内容的敏感词决策树信息过滤算法
邓一贵 ,伍玉英
(重庆大学 a.信息与网络管理 中心;b.计算机学院,重庆400030)
摘 要 :随着互联 网的高速发展 ,各种各样 的信息资源呈指数级增长 ,随之 出现许多负面影响,需要构建一个安全
健康的网络环境。为此,提出针对网页文本 内容的敏感信息过滤算法 (SWDT—IFA)。该算法不依赖词典与分词 ,
通过构建敏感词决策树,将网页文本 内容 以数据流形式检索决策树,记录敏感词词频、区域信息以及敏感词级别 ,
计算文本整体敏感度 ,过滤敏感文本 。实验结果表明,SWDT-IFA算法具有较高的查准率和查全率 ,且执行时间能
够满足当前 网络环境 的实时性要求 。
关键词 :文本过滤 ;敏感级别 ;决策树 ;分流 ;词频
Information FilteringAlgorithm ofTextContent·based
SensitiveW ordsDecisionTree
DENG Yi—gui.W U Yu—ying
(a.InformationandCampusNetworkManagementCenter;
b.SchoolofComputerScience,ChongqingUniversity,Chongqing400030,China)
【Abstract】WiththedevelopmentofInternet,manynegativeeffectscomeoutastheexponentialgrowthofvarious
informationresources,whichmeansthatflmoresecureandhealthynetworkenvironmentshouldbeconstructedrightnow .
Inorderto solvethisproblem ,thispaperproposesa SensitiveW ord Decision Tree forInformation FilteringAlgorithm
(SWDT—IFA)forcontent—basedWebpages.Thealgorithm takesnoconsiderationofdictionaryandwordsegmentation,
buildsthefoundationonthesensitivewordsdecisiontree,letsthewebtextretrievaldecision treeinform ofdatastream ,
recordsword frequency,regionalinformationandsensitivelevel,andcalculatesthesensitivedegreeofthetexttofilterthe
sensitivity.Experimentalresultsshow thatthe SW DT—IFA algorithm hasprecision ratio and recallratio,and low time
complexitywhichcanrequirethereal—timedemandofnetworkenvironment.
【Keywords】textfiltering;sensitivelevel;decisiontree;distributary;wordfrequency
D0I:10.3969/j.issn.1000—3428.2014.09.060
您可能关注的文档
- 《基于心理学的老建筑再利用中四维空间的创造研究》.pdf
- 《基于快速傅里叶变换的地震波加速度构成及其幅频特性研究》.pdf
- 《基于快速独立分量分析算法的气体绝缘开关设备局部放电混合信号分离与缺陷类型辨识》.pdf
- 《基于快速鲁棒性特征匹配的电气化铁路绝缘子不良状态检测》.pdf
- 《基于成像高光谱的苹果树叶片病害区域提取方法研究》.pdf
- 《基于成员聚散度的群组运动模式比较分析》.pdf
- 《基于成本控制的第三方物流服务商与客户企业的共享合同设计》.pdf
- 《基于扩张状态观测的永磁直驱风力发电系统MPPT自适应滑模控制》.pdf
- 《基于扫描电镜的砂岩储层分析:以白云凹陷珠江组三角洲前缘砂体为例》.pdf
- 《基于批判性思维的大学英语课堂教学过程控制研究》.pdf
- 《基于文献计量和关键词的锂离子电池正极材料的研究进展》.pdf
- 《基于文献计量学的世界苹果研究态势分析》.pdf
- 《基于文献计量的国内信息生态位研究现状与展望》.pdf
- 《基于文献阐释法的视频分析理论及其在学校仪式研究中的运用——以柏林一所改革教育小学的“早晨圆圈”仪式为例》.pdf
- 《基于方向信息的随机蕨特征匹配算法》.pdf
- 《基于方差分析的中国沿海港口群港口物流能力及区域经济的差异分析》.pdf
- 《基于旋量理论的主动介入导管运动学研究》.pdf
- 《基于无源超高频射频识别标签的湿度传感器设计》.pdf
- 《基于无线传感网络的果树精准灌溉系统》.pdf
- 《基于无线射频技术的服装零售店管理系统的设计与实现》.pdf
最近下载
- 资料员工作内容.docx VIP
- P气瓶充装证考试题库及答案.doc VIP
- 上海市杨浦区2023-2024学年七年级下学期期中英语试卷 .docx VIP
- 2025年高考真题解析课件:2025年全国新高考二卷英语读后续写(课件).pptx VIP
- 贵阳市中心城区控制性详细规划(总则)——乌当组团.pdf VIP
- 图书出版合同(合同范本)7篇.docx VIP
- (正式版)D-L∕T 1770-2017 抽水蓄能电站输水系统充排水技术规程.docx VIP
- 《结构全寿命维护》课程教学大纲(本科).docx VIP
- SI、PI协同的EMI分析—打印版.pdf
- Unit2 Travelling Around Discovering Useful Structures 课件-2024-2025学年高中英语人教版(2019)必修第一册.pptx VIP
原创力文档


文档评论(0)