基于向量空间模型的网页内容智能过滤系统.pdfVIP

基于向量空间模型的网页内容智能过滤系统.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于向量空间模型的网页内容智能过滤系统.pdf

978 第六部分智能系统、智能决策与控制、经济预测 基于向量空间模型的网页内容智能过滤系统 白广奇1’2,赵合计1,王澄澄1 2总参气象中心北京100081) (1山东大学计算机科学与技术学院,山东济南250061,Email:baiguangqi@126.com 摘要:针对现有网页内容过滤系统存在的不足,本文讨论了基于向量空间模型的网页内容智能分析技术,提出了为 关键词和关键词出现位置添加权值系数的观点,通过动态更新URL名单,增强了网页内容过滤系统对不断发展的互联 网的适应性,较好地提高了过滤的准确性。 关键词:内容过滤;向量空间模型;文本分类 Web The Content BasedontheVector Intelligent FilteringSystem Model Space BAI Guang··qi,ZHAOHe-ji,WANG Cheng··cheng Scienceand Schoolof (Computer TechnologyShandongUniversity,Jinan,250061,baiguangqi@126.com) the ofthecurrentwebcontent webcontent based A、bstract:Fordeficiency filteringsystem,theintelligent analysistechnology onthevector modelis a of coefficienttoboth and ofthe discussed;andconcept space addingweighted keywordspositions is inthis thelistofURLs ofwebcontent keywordsproposedpaper.Throughupdating dynamically,theadaptation filtering for Interactis the of is systemdevelopingstrengthened,andaccuracyfilteringimproved. Filter,VectorModel,Text KeyWords:ContentSpace Categorization Resource Locator)过滤、关键字过滤。但这些技 术存在明显的不足,主要表现在:(1)准确性较差, 1引言 例如将宣传计划生育的网页认为是黄色网页过滤 掉;(2)对不断发展变化的互联网的适应性不够, 网页内容过滤系统的主要功能是筛选向外的 由于因特网本身信息无限容量性、无序组织性和变 web请求,分析进入的web页面从而决定它们的 化快的特点,大部分的过滤系统无法涵盖比它发行 内容性质,禁止不合适的内容在web浏览器中显 晚的网页。 示。随着象黄色、暴力、以及“数据烟雾data smog”、 为了弥补现有系统存在的不足,

文档评论(0)

带头大哥 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档