- 1、本文档共26页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
EBU智能语义分析平台
上海易步信息技术有限公司
Shanghai EBU Info-Technology Co.,Ltd
目录
一、大数据时代的挑战 4
1、挑战:非结构化与预测分析 4
2、应对:语义分析技术 5
二、上海易步:智能语义分析服务 6
三、智能语义分析平台 7
1、平台技术架构 7
2、数据平台 8
3、分析平台 8
(1) 基础语义库 9
(2)浅层语义分析 10
(3) 深层语义分析 10
4、 应用平台 11
(1)政府/媒体 12
(2)高校/科研机构 12
(3)企业/商业 12
5、技术优势 13
四、系统功能特色 14
1、海量信息,及时准确 14
2、自动过滤,分类聚类 16
3、 热点分析,趋势报告 16
4、态度分析,自动褒贬 17
5、可视化报表,一键导出 18
五、应用案例 19
1、上海市企业创新资源管理与分析平台 19
2、佛山网络舆情监测分析系统 20
3、网络视频监测与分析系统 21
4、电视节目舆情监测分析报告 22
5、电商数据网络监察分析系统 23
公司联系方式 25
一、大数据时代的挑战
1、挑战:非结构化与预测分析
麦肯锡公司提出的大数据时代到来的观点,引起了全球广泛的反响。多家机构认为,“大数据”将会成为贯穿以后的一条全新主线。?
图1 大数据的挑战
?真正的大数据时代刚刚开始。标志性的区别就在于:一是数据量的急速增加,预计数据量每18~24个月就翻一番,年数字信息量将会增长50%以上;二是以往的数据只是结构化数据、非个性化的数据;而进入2012年,非结构化数据占有比例达到互联网整个数据量的75%以上;三是对数据价值的要求更高,传统的统计报表已满足不了需求,基于深层数据挖掘的预测性分析成为重点。
随着大数据时代的来临,我们将面临一场变革,大数据将成为机构和企业发展的当务之急;对这些新数据型态的应用,带来可持续的竞争优势。
2、应对:语义分析技术
在大数据时代,最关键的是处理数据的能力:最大的挑战是对信息的有效掌管,即如何筛选来源,深度分析与挖掘,分享其价值。
要解决这些问题,就需要一种这样的信息处理不但能够处理所有类型的信息,而且能自然语言处理(NLP,Natural Language Processing) 是研究人与计算机交互的语言问题的一门学科。处理自然语言的关键是要让计算机“理解”自然语言,一方面它是语言信息处理的一个分支,另一方面它是人工智能的核心课题之一
二、上海易步:智能语义分析服务
上海易步信息技术有限公司成立于上海张江高科技产业园区,是一家研发语义分析技术的高科技公司,提供基于大数据的行业情报分析服务。公司专注于大数据、智能技术和语义分析等领域,主要致力于智能语义技术的开发和市场应用,尤其侧重于各类数字化信息的智能语义分析和深度数据挖掘。
图3 公司定位与产品技术
公司团队具有十多年的底层技术积累,投入了数千万元的研发资金,取得多项知识产权。利用搜索引擎和语义分析方面的技术优势,公司着力开放式(互联网)与封闭式(数据库)数据的采集,大数据架构的数据集成和存储并提供智能语义分析和深层数据挖掘,以满足大数据时代的专业信息服务需求。
公司已研发出基于大数据的“EBU智能语义分析平台”,并相继推出了应用于政府/媒体行业的舆情监测分析系统、适用于高校/科研院所的科研情报分析系统、适用于企业市场的商业智能分析系统;该平台目前已经进入成熟应用和市场销售阶段,主要面向政府、高校、科研机构、企业、电子商务网站等用户。
三、智能语义分析平台
1、平台技术架构
EBU智能语义分析平台是一个集实时数据采集和存储、语义分析、专业知识库的大数据处理平台,可在智能分析的基础上实现数据集成、自动分析和知识服务。
图4 EBU智能语义分析平台架构
平台针对用户的实际需求,可实现大数据环境下的海量、多来源、异构数据进行自动采集、筛选、结构化、标引,并进行复杂语义深度解析,帮助用户在面对海量数据时第一时间获取可分析数据并挖掘隐藏在数据背后的深层涵义。
2、数据平台
数据平台采集各个来源的多种数据,并以其能够实现快速处理和检索的独特结构储存它们。
分析平台是整个系统的核心和关键,主要是对储存和索引的数据进行智能语义分析和深层数据挖掘。在处理数据时,平台能联系基础语义库和语境来分析,包括语义库匹配、自动摘要、结构化抽取、分类、聚类、内部超链接、相似度分析、热点分析、褒贬分析等。
分析平台包括基础语义库、浅层语义分析和深层语义分析三部分:
图6 分析平台架构
(1) 基础语义库
语义库系统是语义分析引擎运行的基础语料库,包括中文分词词库、网络新词词库、中英文倾向性词库等。该部分收录现代汉语词汇和网络词汇达到20万条以上,其中,中文倾向性词条达到2万条以上,英文倾向性词汇达到11万条。
该语义库
您可能关注的文档
- 850nm VCSEL HV-3535SN-700 产品规格书.PDF
- 8895CSNG7EP3 (工厂调试说明).PDF
- 8分钟掌握PLC顺序功能图编程.DOC
- 8种城市绿化攀缘植物的光合作用和水分关系特性-热带亚热带植物学报.PDF
- 8渗透试验.PPT
- 92学年度入学新生电子工程系大学部四技专业课程流程图.PDF
- 94上智慧鸟小班主题三:小小秘密花园.DOC
- 96指考试题解析.DOC
- 97年教室美化绿化布置比赛 - 楠梓国中.PDF
- 98年特种考试交通事业铁路人员考试及98 年公务人员特种.PDF
- 2023年江苏省镇江市润州区中考生物二模试卷+答案解析.pdf
- 2023年江苏省徐州市邳州市运河中学中考生物二模试卷+答案解析.pdf
- 2023年江苏省苏州市吴中区中考冲刺数学模拟预测卷+答案解析.pdf
- 2023年江苏省南通市崇川区田家炳中学中考数学四模试卷+答案解析.pdf
- 2023年江西省吉安市中考物理模拟试卷(一)+答案解析.pdf
- 2023年江苏省泰州市海陵区九年级(下)中考三模数学试卷+答案解析.pdf
- 2023年江苏省苏州市高新二中中考数学二模试卷+答案解析.pdf
- 2023年江苏省南通市九年级数学中考复习模拟卷+答案解析.pdf
- 2023年江苏省南通市海安市九年级数学模拟卷+答案解析.pdf
- 2023年江苏省泰州市靖江外国语学校中考数学一调试卷+答案解析.pdf
最近下载
- 第三节 免疫分析仪器的维护_医疗设备维护概论_第四章 医用检验设备的维护.pptx
- 垃圾分类整治工作总结.pptx
- 2024年常见人力资源面试题库(通用7篇).pdf
- 《糟糕,身上长条纹了!》绘本故事PPT2套.pptx
- 25题规划发展岗位常见面试问题含HR问题考察点及参考回答.pdf
- 清华大学央企班组长远程培训自测题及答案(17门课合集).pptx
- 英语国家概况课后习题答案解析(完整版).doc
- 幼儿园 大班数学《美丽的对称图形》.pptx VIP
- 新视野大学英语(第三版)读写教程Section B-Too much of a good thing – A real addiction.ppt
- 2023年中小学教师职称考试试题含答案.docx
文档评论(0)