- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于Logistic模型医疗网络舆情监控与预警系统研究
基于Logistic模型医疗网络舆情监控与预警系统研究
摘要:为了能够有效地监控和预警医疗网络的舆情,及时地解决可能出现的医疗舆情危机,提高医院舆情危机应对能力,提升医疗服务质量,医疗舆情监控和预警系统显得尤为重要。该文根据医疗网络舆情的特点,对医疗网络舆情监控和预警的相关技术进行了研究。主要包括数据收集和预处理、医疗知识库、医疗事件预警模块的设计,最后实现了一个原型系统以验证系统的有效性。
关键词:Logistic;医疗舆情;监控;预警
中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2018)04-0010-02
1 背景
随着计算机和网络技术的快速发展,互联网已成为现代社会最重要的媒介。CNNIC第40次报告显示,截至2017年6月,我国网民规模达7.51亿,互联网普及率为54.3%。其中,即时通信用户数为6.92 亿,搜索引擎用户数为6.09亿,网络新闻用户规模为6.25 亿。微信朋友圈、QQ 空间作为即时通信工具所衍生出来的社交服务,用户使用率分别为84.3% 和65.8%。海量用户通过互联网获取最新资讯,互联网虽有利于自由表达自己的思想,也能被一些坏人利用,误导舆论。
医院舆情危机指能够对医院正常运营,或者声誉造成潜在破坏的舆情。在现今医患关系非常紧张的形势下,本来一个普通的医患纠纷,通过互联网的放大作用,很可能形成舆情危机事件。因此,有必要建设高效的医疗网络舆情监测和预警系统,便于医疗部门尽早采取应对措施,将危机消灭在初期。
本文基于Logistic模型,设计并实现了一个医疗舆情监控与预警系统。下面将对本系统的构成、功能模块以及实现进行介绍。
2 系统构成
本文提出的系统的结构如图1所示。
系统主要包括6个模块:数据采集及预处理模块、医疗舆情常态监控模块、医疗敏感知识库模块、舆情危机预警指标体系模块、预警多元回归模型模块以及四级预警?c展示模块。
3 系统实现关键技术
3.1 数据采集及处理模块
本模块的任务是负责博客、论坛、新闻、微博上关于医疗舆情网页的抓取并存入MYSQL数据库。本模块的功能有两个:一是提供对新浪博客、天涯论坛、新浪微博、新浪新闻医疗舆情网页抓取的接口。另外可以提供对新浪博客、天涯论坛、新浪微博、新浪新闻实时抓取新数据的接口。本模块使用的软件及工具有:1)Eclipse环境及jdk 1.8.0_131的java语言。2)WebMagic爬虫框架,采用其0.7.2开源版本。3)quartz任务调度框架,采用其2.2.3开源版本。4)selenium 框架,采用其2.44.0开源版本。5)chrome的自动化软件。
爬虫爬取具体步骤:
1) 创建词库、并且分类。
如图2所示,创建表。
2) 分析网页、编写爬虫
(1) 根据关键词、标题、排序等参数编写url。
(2) 分析该网页的文章url的格式、找到规律,编写正则表达式。
(3) 将该网页中所有符合“文章正则表达式”的网页添加到待爬取队列当中。
(4) 将该页的分页也编写正则表达式,并且将符合“分页正则表达式”的网页添加到待爬取队列当中。
(5) 将文章的网页中的标题、正文、日期、作者等相关信息通过webmagic框架中的方法提取出来,并且存到数据库中。
3) 根据需要、实时抓取
可以将以上爬虫简写成只爬取前两页的内容,但是获取到的结果都要经过时间优先,且结果都要根据标题检索。
3.2 医疗舆情知识库模块
医疗舆情知识库模块由医疗事件库、医疗关键词库、关注站点库和微博虚拟身份库组成。医疗事件库收集了近年来具有较大社会影响力的50多个涉及医疗纠纷、医患关系、医疗事故等的医疗领域事件。医疗关键词库收集了200多个医疗关键词组,为识别医疗信息提供帮助。微博虚拟身份库包含两百多个重点关注用户,有助于提高数据抓取的目标性。
3.3 医疗事件预警模块
3.3.1 预警系数构成
根据系统采集到的数据,制定了舆情发布、舆情发布者两个一级系数,舆情发布广度、舆情发布活速率、舆情发布者具有的影响力、舆情发布者活跃程度四个二级系数,以及六个三级系数,如表1所示。
3.3.2 预警模型构造
根据前期采集到的医疗事件,采用多元Logistic回归训练模型,可判别出对医疗事件预警起关键作用的指数,同时训练出各个指数的权重值。
医疗舆情事件的预警可以认为是一个具有两个值的因变量的Logistic回归模型,研究因变量y取值为1(预警)的概率p与自变量x之间的关系。自变量x是一个向量,它是影响y的因素。设在向量x条件下y=1的概率是p=p(y=1|x),那么所得出的公
您可能关注的文档
- 基于K―means聚类算法信号源识别分类研究.doc
- 基于K―means视频智能存储算法.doc
- 基于k―means自动三支决策聚类方法.doc
- 基于K―means聚类算法成绩分析应用探究.doc
- 基于K―means颜色聚类分割与边缘检测文字提取.doc
- 基于K―SVDγ能谱特征提取及核素识别.doc
- 基于k―匿名轨迹数据隐私发布研究综述.doc
- 基于K均值动态聚类分析企业信用等级划分法.doc
- 基于K均值聚类及模糊支持向量机海洋灾害风险预警方法.doc
- 基于K均值聚类算法雾天识别方法研究.doc
- 基于Logistic模型农民参与农民专业合作组织影响因素分析.doc
- 基于Logistic模型商业银行个人消费信贷风险评估研究.doc
- 基于Logistic模型城镇医疗保险制度满意度实证研究.doc
- 基于logistic模型大学生校园代理消费意愿分析.doc
- 基于Logistic模型大学生使用校园综合性服务平台意愿研究.doc
- 基于Logistic模型对河南省新型职业农民接受远程培训意愿分析.doc
- 基于logistic模型影响大学毕业生就业因素分析.doc
- 基于Logistic模型小微企业信用风险度量研究.doc
- 基于logistic模型杭州市老人入住养老院影响因素实证研究.doc
- 基于Logistic模型水污染经济价值损失研究.doc
原创力文档


文档评论(0)