不原创精品良网页判定算法的研究与实现.docxVIP

不原创精品良网页判定算法的研究与实现.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
不良网页判定算法的研究与实现 赖勇浩(计算机科学与技术师范专业) 指导老师:谢赞福副教授 摘要:不良网络信息过滤是一个切合社会迫切需求,应用面极广,体现大学生社会 责任感的极具商业价值的课题,是人工智能与数据挖掘相关技术的综合性应用,其最 垂要组成部分是对网页性质的判定?本文的不良网页判定算法对文本和图像这两个 最重耍的网页组成元素进行检测分析,由软件系统自行判定网页是否包含色情,暴力, 反动等不良信息.提出了基于学习型知识库的文本内容检测分析算法和反误判算法, 综合了基于肤色模型和人脸特征的图像检测算法,建立文木与图形结合的数学模型, 创造性地将文木与图像两面结合起来判定网页的性质,极大地提高了识别率,降低了 误识率.在已经实现的过滤系统一一《上帝Z手》上,对不良网页的识别过滤率高达 99.2% ? 关键字:不良信息过滤判定算法识别文本检测 Research and Implementation of Judging Bad Web Pages Algorithm Yonghao Lai Directed by: Professor Zanfu Xie Abstract: Bad network information filter is a commercially valuable task that suits to the exigent requirement of the society and has a huge application.lt adequately incarnates the social responsibility of the undergraduates.lt is a correlation technique all-around application of Arificial Intelligence and Data Mining.The most important ingredient is the judgement to the web page proterty.Judging bad web pages algorithm of this passage is a detecting analusis towards to text and image,which are the most important component element of web pages.This software system itself judges the web pages whether contains the web information such as eroticism,violence and counteraction.Suggest the algorithm of detecting text content based on studying repository and anti-misdetecting algorithm. Bi nd the image detectomg algorithm which based on complexion model and face feature,eatablish the mathematical model which bind text and image,creatively judge property of the web pages by detecting text and image,infinitely improve the recognition rate,reduce the anti-missing rate.In our filter system-GODfS HANDjhe reconition rate to bad web page have been up to 99.2%. Keywords: information filter Judging bad web pages algorithm5Recognition,Text detecting. 引言 中国互联网业形成声势也就5年时间,但形象和境况却已变幻多次,互联网会 在短短2?3年Z间迅速“变色”。以短信为契机,互联网已经成为色情/暴力/反动的 主战场?一切正在往相反的方向加速滑行,越来越“黄”,越来越“黑”,形成恶性循 环,失去了界限,使得互联网的主力——青少年成为主要的受害者。由于高匿名性、 高隐私性、高互动性和无地域性等特点,使得成人内容根本无法有效管理和制约。 对青少年的侵害,远比不良的网络游戏危害更人、更严重。 令人担忧的是,我们传统的监管法规、技术手段乃至对网络色情业的认知都还 停留在初级阶

文档评论(0)

ggkkppp + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档