- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
网络信息过滤技术
网络信息过滤技术
组长:刘伟 1221330048
组员:史波 1221330053
张旭 1221330056
伍思同 1221330068
目录
基本信息与发展历史 ——刘伟
网络信息过滤技术方法 ——史波
网络信息过滤技术应用 ——伍思同
现状分析及发展趋势 ——张旭
互联网的飞速发展在给人们的工作、生活、学习等诸多方面带来巨大便利的同时也带来诸如“信息超载”以及“不良信息”和垃圾信息的侵害等问题。信息过滤技术由此产生,并广泛应用到了网络的各种信息处理过程中,对网络信息实用化具有极大的推动作用。
网络信息过滤技术采取适当的技术措施,对互联网不良信息进行过滤,既可阻止不良信息对人们的侵害,适应社会对意识形态方面的要求,同时,通过规范用户的上网行为,提高工作效率,合理利用网络资源,减少病毒对网络的侵害,这就是信息过滤技术的根本内涵。
网络信息过滤是根据一定的标准运用一定的工具从动态的网络信息流中选取用户需要的信息或剔除用户不需要的信息的方法和过程。
网络信息过滤有利于减轻用户的认知压力。它在为用户提供所需要信息的同时,着重剔除与用户不相关的信息,从而提高用户获取信息的效率;它根据用户信息需求的变化提供稳定的信息服务,能够节约用户获取信息的时间,从而极大地减轻用户的认知负担,起到减压阀的作用。
目前网络信息过滤的工作概括为2项:一是建立用户需求模型。即用户模板,用于表达用户对于信息的具体需求。建立用户需求模型的主要依据是用户提交的关键词、主题词或示例文本。
二是匹配技术,即用户模板与文本的匹配技术。简单地讲,任何信息过滤系统就是根据用户的查询创建用户需求模型。将信息源中的文本有效表示出来,然后根据一定的匹配规则,将信息源中可以满足用户需求的信息返回给用户,并根据一定的反馈机制,不断地调整改进用户需求模型,以期获得更好的过滤结果。
网络信息过滤对个性化信息服务起到了巨大的推动作用。在个性化信息服务中,最重要的是收集和分析用户的信息需求。由于信息过滤的反馈机制具有自我学习和自我适应的能力,可以动态地了解用户兴趣的变化,掌握用户的信息需求,从而为用户提供更有针对性的信息。在协作过滤系统中,还可以根据用户之间的相似性来推荐信息,从而有可能为用户提供新的感兴趣的信息,拓宽用户的视野。
通过网络信息过滤,可以减少不必要的信息传递,节约宝贵的信道资源。利用网络信息过滤,可以对网络信息的流量、流向和流速进行合理的配置,使网络更加畅顺。而对于用户来说,信息过滤由于剔除了大量的不相关信息的流人,可以避免塞车现象。
网络信息过滤技术的发展历史
“信息过滤”最早出现在1982年的3月美国计算机协会上。
1992年,代表了世界文本检索领域最高水平和文本检索领域最权威的国际会议之一的文本检索会议召开,并将过滤作为其一个重要的议题。
会议对信息过滤学科形成和发展提供了强有力的支持。
网络信息过滤技术方法
基于内容的信息过滤
从网络信息过滤结构
基于合作的信息过滤(协同过滤)
内容过滤
从网络信息过滤的依据 网址过滤
混合过滤
基于内容的信息过滤
基于内容的信息过滤通过用户模型(user profile)来描述用户的信息需求,将新获取的信息与用户模型进行相似度计算,主动将相似度高的信息提供给用户。
内容过滤的基本思想是,给用户推荐和他们之前喜欢的物品在内容上相似的其他物品。核心任务就是计算物品的内容相似度。
基于内容的过滤优缺点
优点:基于内容过滤利用资源和用户兴趣的相似性来过滤信息,它的关键问题是相似性计算,其优点是简单、有效。这种过滤技术已经比较成熟,使用也相对较广。
文档评论(0)