- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种基于Java Web敏感词过滤方法研究与实现
一种基于Java Web的敏感词过滤方法研究与实现
摘要: 本文研究一种基于Java Web的敏感词过滤系统,能够识别敏感词,在客户端用户发送数据时,系统能够自动阻断聊天内容,并且将敏感词替换为指定特殊符号关键词的敏感词。该系统基于 B /S 结构的Java Web分层框架结构进行架构设计,能够在对用户透明的情况下,自动阻断含有敏感词的聊天内容提交,并且将敏感词替换为指定特殊符号关键词。 实验结果表明该系统能够有效阻止含有敏感关键词的聊天内容提交。
关键词: 敏感词过滤; Java Web; 聊天系统; 关键词替换
中图分类号:TP393.08
文献标志码:A
文章编号:2095-2163(2017)04-0021-03
0引言
随着互联网与移动应用的飞速发展和普及,在互联网上的信息量呈现爆炸式增长,这给信息内容?|量的监测和过滤带来严峻的考验。目前已有的绝大部分网络监控系统主要针对己经生效的网络信息,不良信息有时候仍然在网上传播。针对网络不良信息过滤中存在的这些问题,基于文本的过滤模式可以依据任何关键词进行搜索并确定其内容性质,具有高度的灵活性,而图片过滤主要是针对色情图片而言,在技术手段和分级上目前仍然呈现可观难度,毕竟如何区分艺术和色情在时下的生活进程中也还有待直接确切的现实争议定论。即使解决了艺术与色情的领域划定,却仍然存在着准确率不高的问题。基于此,本文则依据应用场景的需求,设计研发了一种在信息源头实现敏感词过滤的敏感词过滤系统,提高了在关键词过滤中的时间效率。
[BT4]1B/S体系结构
B/S是Brower/Server的缩写,即浏览器/服务器结构。在这种结构中,客户端不需要开发任何用户界面,而统一采用如IE和火狐等浏览器,通过Web浏览器向Web服务器发送请求,由Web服务器进行处理,并将处理结果逐级传回客户端,综上过程直观表述可如图1所示。这种结构利用不断成熟和普及的浏览器技术来获取原需运行复杂专用软件才能提供输出的强大功能,从而节约了开发成本,是一种全新的软件体系结构,因而已然成为当今应用软件的首选体系结构。
[PS傅明建1.EPS;S*2;X*2,BP#]
2Servlet
Servlet即Java服务小程序,是使用应用程序设计接口以及相关类和方法的Java程序。同时,还可以作为一种插件,嵌入到Web服务器中运行,并可呈现强大功能,Servlet在服务器上运行主要用于支持展开和客户之间的通信,当客户端传来一个Http请求时,通过调用Servlet方法来向客户端发送一个响应。不但可以处理Http请求中的业务逻辑,而且还可以输出HTML代码来显示指定页面。
[BT5]2.1Servlet过滤器
Servlet过滤器与Servlet十分相似,但却具有拦截客户端(浏览器)请求的功能,Servlet过滤器可以改变请求中的内容,来满足设计开发中的实际需要。对于程序开发人员而言,过滤器实质就是在Web应用服务器上的一个Web应用组件,用于拦截客户端(浏览器)与目标资源的请求,并对这些请求引入一定过滤处理再发送给目标资源,过滤器的处理方式如图2所示。
2.2基于Servlet过滤器的敏感词过滤
Servlet过滤器能够对Servlet容器的请求和响应对象进行检查和修改。过滤器本身并不产生请求和响应对象,而只是提供过滤功能。基于这个特点,本文采用基于Servlet过滤器的方法来研究敏感词过滤,并以聊天系统应用为例(可以适应任何基于Web的系统)来实现敏感词过滤。该方法的步骤设计内容可详述如下。
1)先设计一个简单的聊天室客户端界面,如图3所示,用于通过Http请求提交聊天内容。
2)然后,编写一个Servlet,并部署配置Servlet,用来获得聊天时提交的聊天内容,并辅以后续延展处理,进一步添加到request中。目前,部署Servlet有2种方式:
① 在Web.xml中进行部署Servlet,只要用户请求的URL和的子标记指定的模式匹配,Web服务器就会自动调用该Filter的doFilter()方法;
② 基于注解的方式部署配置Servlet,在Servlet3.0中提供了注解@WebFilter,使得可以不再需要在Web.xml文件中呈现Filter的部署描述。
如果设计了多个过滤器,且过滤器拦截路径相同时,系统将首先按照标记在Web.xml中出现的先后顺序执行过滤器,然后再按照过滤器类名的字典顺序执行注解的过滤器。但在实际的Web工程中,不需要大量开发Filter,因此,采用哪种方式都可快速成熟地部署过滤器。这里为论述简明清晰起见,本文中采用在Web.xml中部署Servlet,部署代
文档评论(0)