- 1、本文档共47页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
互联网舆情信息采集研究系统关键技术分析-软件工程专业论文
目录第一章 绪论11.1 课题背景和意义 11.2 研究目标及开发内容 21.3 全文安排 2 第二章 文献及技术综述4 2.1 互联网舆情 42.1.1 互联网舆情与舆论42.1.2 互联网舆情特点52.1.3 互联网舆情监测相关的关键性技术62.2 垂直搜索 72.2.4 垂直搜索概念72.2.5 搜索引擎的分类82.2.6 垂直搜索研究概况92.3 网页过滤 102.4 信息抽取 11 第三章 舆情系统的分析与概要设计12 3.1 系统设计的目标 123.2 系统需求分析 133.3 系统概要设计 153.3.1 系统业务流程与系统功能模块框图153.3.2 数据库设计16 第四章 系统功能设计与实现204.1 舆情采集功能模块的设计与实现 204.1.1 垂直搜索爬虫的工作流程204.1.2 垂直搜索爬虫的搜索策略的设计204.1.3 网页过滤器算法设计214.1.4 新闻及论坛网络拓扑结构的设计214.1.5 网络爬虫的具体实现234.1.6 信息抽取程序的设计与实现264.1.7 信息抽取模板的设计264.1.8 信息抽取程序的实现274.2 舆情检索功能模块的设计与实现 304.2.1 舆情检索模块主要功能的设计304.2.2 舆情检索功能模块的实现304.3 舆情智能分析模块的实现 324.3.1 舆情主题分析算法设计324.3.2 舆情智能分析的实现334.4 舆情预警模块的实现 344.5 舆情研判与报告模块的关键功能的设计与实现 354.5.1 报告功能模块的设计354.5.2 报告功能模块的实现36第五章 结论与展望395.1 结论 395.2 展望 40参考文献41发表论文和科研情况说明44致谢45第一章 绪论1.1 课题背景和意义舆情,亦称为群情、民情,是“社会舆论情况”的简称,是指在一定的社会 空间内,围绕一些中介性社会事件的发生、发展和变化,作为主体的民众对作为 客体的社会管理者及其政治取向产生和持有的社会政治态度[1]。它是较多群众关 于社会中各种现象、问题所表达的信念、态度、意见和情绪等等表现的总和。互联网舆情,也称之为网络舆情,它是由于各种事件的刺激而产生的通过 Internet传播的人们对于该事件的所有认知、态度、情感和行为倾向的集合[2]。它 是社会舆情在Internet空间的映射,是社会舆情在Internet的直接反映。在Web2.0 时代到来以前,传统的社会舆情存在于民间、大众的思想观念和日常的街头巷尾 的议论之中,舆情的采集和分析只能通过明察暗访、民意调查等方式进行,获取 成本很高,获取效率低下,样本少而且容易流于偏颇[3]。而随着Internet的发展, Web2.0 时代的到来,论坛、博客、微博、播客、Facebook、Twitter和WIKI等使 大众已经丛 1.0 时代的信息接收者逐渐成为信息的创作者,社会舆情由民间的口 口相传转向了网络舞台,而互联网舆情可以采用网络自动抓取等技术手段方便获 取并通过垂直搜索等信息技术进行分析,不但效率高而且信息保真(没有人为加 工),覆盖面全[4]。互联网舆情事件发生的范围广,传播的速度快,不受时间和空间的限制,易 对社会的稳定和网民态度产生重大的影响,互联网信息内容丰富多样,既有海量 进步、健康、有益的信息,也有不少反动、邪教、迷信、淫秽色情的内容[5]。Internet 作为一块正在加速膨胀的思想阵地,加上其发散性、隐蔽性、虚拟性、渗透性和 随意性等特点[6-8],越来越多的人们愿意通过论坛、博客、微博、播客、Facebook、 Twitter和WIKI等表达自己的个人想法,因此网络舆情的爆发将以“内容威胁” 的形式逐渐对社会公共安全形成威胁[9,10]。因此非常有必要及时采集并分析事件 或话题的发展趋势。天津市是由于特殊的历史和地理位置,在国家经济战略格局中占有举足轻重 的地位,尤其是天津滨海新区在新时期实现了跨越式的发展,其中信息产业的发 展占有关键性的历史作用;随着信息产业的发展,天津的网民和网站总数保持飞 速增长。在建设和谐社会的背景下,滨海新区如何适应互联网信息迅猛发展的需要,通过一套稳定的可延续的系统更及时、准确、全面的掌握和分析网上涉滨舆情,加强对 网上舆论引导的有效性是非常必要。1.2 研究目标及开发内容当舆情产生聚集时就可以向舆论转化,因此建设互联网舆情信息采集分析系 统,目标就是通过及时、准确、全面搜索网上涉滨的敏感信息、涉滨重大突发事 件的信息、涉及新区重大负面新闻的相关信息、重大突发性群体性事件以及能够 查看境外对涉滨重大事件(政策)的相关评论和报道等,通过对采集的信息进行 加工、智能分析、信息提取等处理,并供决策层及时制定有效的应对措施
您可能关注的文档
- 核壳结构分子筛制备及由环已烯间接合成环己醇研究-化学工艺专业论文.docx
- 红树莓果酒酵母优选及中试放大工艺研究-食品工程专业论文.docx
- 红芪超滤物对x线辐射肝癌hepg2细胞自噬性凋亡及p53基因表达的影响-中西医结合临床(内科)专业论文.docx
- 红头文件的规范化探析-思想政治教育专业论文.docx
- 横向晶场和键随机的混合自旋系统的临界行为和磁化性质-理论物理专业论文.docx
- 胡风的现实主义文学批评观及其当代意义-文艺学专业论文.docx
- 互联网企业会计确认与计量研究-会计学专业论文.docx
- 淮海地区汉画像石艺术分析-美术学专业论文.docx
- 环保型沙生灌木型材制备工艺研究-材料加工工程专业论文.docx
- 环糊精及其衍生物对药物溶出影响-药物分析学专业论文.docx
- 精选合同书买卖合同书2025年通用.docx
- 2025届高三生物二轮复习课件育种技术微专题.pptx
- 4.1人类活动对生态环境的影响课件高二上学期生物人教版选择性必修2.pptx
- 精选合作人合伙协议书2025年通用.docx
- 精选合伙美容院协议书2025年通用.docx
- 6.3细胞的分化课件高一上学期生物人教版(2019)必修1.pptx
- 6.2 自然选择与适应的形成(课件)高一下学期生物人教版(2019)必修2.pptx
- 高三生物一轮复习课件 第6讲 体液调节与神经调节的关系.pptx
- 高三生物一轮复习课件第1讲 走近细胞2.pptx
- 6.3细胞的分化课件-高一上学期生物人教版(2019)必修1.pptx
最近下载
- 中国视疲劳诊疗专家共识(2024年).pptx
- (完整版)克鲁格曼国际经济学理论与政策第十10版课后题习题答案-1.doc
- 2024年陕西省初中信息技术学业水平考试题库附答案(共4套).pdf
- 《2025年国家医疗质量安全改进目标》解读PPT课件.pptx VIP
- 实验4:条件分支结构基本应用.docx VIP
- 2024年高级经济师《财政税收》试题及答案(最完整版) .pdf VIP
- AP英语语言与写作 2021年真题 附答案和评分标准 AP English Language and Composition 2021 Exam with Answers.pdf VIP
- 电梯安装工程全套报验资料.pdf
- 中医技术操作规范 颊针.pdf
- 2024年高级经济师《财政税收》试题及答案(最完整版).docx
文档评论(0)