- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
对互联网教育舆情监测系统研究
摘要:互联网科学信息技术的快速发展和进步使得 人们对于互联网教育舆情监测系统的研究也越来越重视。本 文概述了互联网教育舆情监测系统的内涵以及互联网教育 舆情监测系统的主要结构组成,并分别从互联网信息采集与 预处理技术、舆情关键信息抽取技术、文本表示与主题发现 技术以及网络舆情内容分析四个方面进行互联网教育舆情 监测系统技术探讨。
关键词:网络;舆情监测;技术分析;网络教育
中图分类号:TP311. 52
随着社会科学技术以及互联网技术的快速兴起与发展, 互联网给人们带来的信息资源也越来越广泛和深入。人们在 运用互联网的同时对于内心感情以及态度的表达也越来越 重视,公众的表达自由权以及诉求渠道也越来越多。因此, 面对社会上日益增长的互联网舆情,必须要建立科学合理的 互联网舆情收集以及分析处理支撑体系,保证互联网舆情能 够实现及时、科学、全面的分析和研究,所以本文对于互联 网教育舆情监测系统的研究具有很重要的参考价值。
1互联网教育舆情监测系统概述
1. 1互联网教育舆情涵义
互联网舆情是围绕国家法律法规、生产发生的事件、人 物、国家方针政策等影响民众利益的中介性关联物,民众对 执政者及其颁布的方针政策的观点和态度。随着网络的出 现,人们对其依赖性越来越强,互联网舆情从开始范围狭窄 发展到今天遍布互联网每个角落,经历了一个漫长的时期。 网络舆情代表着公众的心声,是时代进步的产物,表达在互 联网空间中的政治态度和舆情传播。针对网络的特点,互联 网络舆情有随意性、突发性、隐蔽性和直接性、多元性等特 点。
1.2互联网教育舆情监测系统结构
互联网舆情系统主要包括信息收集、信息处理、数据库 和前端应用四个模块。其中信息收集模块支持多处理器,具 有灵活的处理信息功能,能够合理应用多线程技术,根据具 体情况在指定网站和给定数据中寻求原始信息的模块。
信息处理模块完成数据结构化处理,将数据按照一定规 格分类,根据关键词建立全文主索引,通过对象跟踪和分析 语义完成自动摘要功能。信息处理模块根据其完成功能主要 有预处理子模块、全文索引模块、自动分类模块、对象跟踪 子模块等。数据库系统主要完成数据存储功能,对系统中的 数据保存在数据库中,为互联网应用提供平台。前端应用模 块可以完成各种搜索功能,这里的搜索可以是热点事物的搜 索、用户需求的关键词搜索、引擎搜索等;也可以完成自动 汇总统计功能。前端应用模块包括五大子模块,具体有关键 词自动推荐、管理、搜索、统计报表、釆编辅助功能五大子 模块。因此,在开发互联网舆情监测系统时,应该重点考虑 如何才能更好地实现信息处理模块及前端应用模块的功能, 如何将二者的功能打造得更完美。
2互联网教育舆情监测系统技术探讨
2. 1互联网信息采集与预处理技术
通常情况下,互联网信息采集主要采用的是垂直搜索引 擎技术,将互联网的主要信息进行自动的分类以及识别,实 现信息的自动去除和自动抽取,这种处治搜索引擎技术能够 比较准确地实现互联网信息的采集。主要是进行互联网主题 信息的智能搜索以及下载功能,并且具有互联网信息的反屏 蔽方法,随时进行互联网信息的更新搜索以及深度控制,从 而根据互联网的信息实现智能下载,还能够运用模拟浏览器 技术进行互联网页面信息的采集工作。在互联网相关信息的 判别过程中,自动识别技术以及自动扩展功能的运用也十分 广泛,自动识别技术能够保证采集的互联网信息具有一定的 广度以及动态性的信息变化。除此之外,互联网教育信息的 采集必须要进行信息的消重,这也是信息采集过程中必须需 要的技术,一般情况下可以从URL列表进行信息的消重,还 可以采用网页指纹消重技术以及以领域知识数据库为基础 进行信息消重,这几种消重技术均能够有效地保证互联网信 息的无重复性。
互联网信息预处理技术是对于互联网采集到的信息资 源进行初步地分析以及处理工作,为下面进行互联网舆情信 息的抽取以及信息内容的分析提供必要的条件,通常情况下 使用的是基于统计以及规则相结合的信息分类以及过滤的 技术。首先将互联网信息根据不同领域以及不同行业进行分 类,并且结合现有的信息资源进行领域以及行业舆情的分析 和处理。除此之外,还对互联网的信息资源进行客观上的评 价以及态度上的分类处理。
2.2舆情关键信息抽取技术
信息抽取技术中的智能节点识别技术是对网络信息快 速、及时、准确的提取,提取过程中应用的是本体库和语义 网络的信息提取技术。该技术可以根据需要关键词进行有目 的的筛选,将关键词和属性关键词锁定,自动选择需要内容。 如果所选定的关键词不存在相应的内容,那么就会根据属性 关键词提取内容页面。
目前互联网舆情关键信息的抽取技术主要有网页去噪 功能、智能节点识别技术以及逻辑信息抽取技术。网页去噪 功能主要是根据互联网的信息
文档评论(0)