信息服务行业的数据整合、挖掘、启迪资料.ppt

信息服务行业的数据整合、挖掘、启迪资料.ppt

  1. 1、本文档共32页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
应用三:人才评估 一个研究学者的研究主题及其延展关系可以反映这个学者的研究趋势变化,例如他的发文主题、被引主题和引用主题 为机构用户量身定制的个性化主页可以直观呈现其下属机构或者学科领域的不同研究方向和主要研究人员 关联数据的对象化归纳与整理使科研管理、科研绩效分析所需数据得以直观呈现 构建机构知识体系 机构特色资源及科学数据的整合,将成为智立方知识管理功能的一部分内容,不仅将响应元数据的整合和知识对象描述功能,还会同时响应原文保障的整合流程 机构各类比较分析及研究绩效分析报告,将成为智立方机构知识管理、辅助创新的重要工具 元数据优势 技术架构优势 读者体验优势 开放合作优势 整合的文献元数据是基于专业知识内容,而非泛泛的报纸新闻和网页采集数据,其中的产品样本和科技报告是智立方独家收录的文献资源。 数据厚度方面,智立方源文献达到15个字段深度,参考文献达到10个字段深度。 基于文献建立的知识对象词典(600万人物、200万主题、20万机构、5万余资助及传媒,10亿数据关系)使知识的深度挖掘成为可能。 1、主题词词典—— 卡方检验、词频筛选方法构建主题词表;马尔科夫模型、信息熵、潜在语义分析、模式识别、复述等方法识别错词、通用词与词间关系; 2、人物词典—— 构建作者特征,利用机器学习算法(朴素贝叶斯、近邻传播等)实施作者重名消歧; 3、机构词典—— 模式匹配、机构实体识别结合人工处理,完成机构标准名称规范、层级关系构建、机构变更关联等; 4、西文对照—— 响应了部分人物和机构的中西文对照,更多对象中西文对照工作有待完善; 5、众包智慧——机构或读者参与词典的建设、整理,将会使智立方的情报服务质量得以极大提升,并更有针对性; ?采用了更加适合大数据挖掘分析的Hadoop平台技术架构,是百度、淘宝等大型企业共同采用的成熟架构。平台完全能支撑日千万级别的使用量。 智立方的后续技术研发方向,涉及知识对象的价值评级、用户行为分析及个性化推荐、面向教育科研的社会化网络运营等。 智立方以云服务的方式为用户提供服务,也可以帮助图书馆节省大数据平台设备管理维护方面的投入。 智立方立足于对有效资源的知识梳理,而非海量资源的粗放堆砌,所提供的知识内容脉络有助于用户感受图书馆的专业信息服务,同在搜索引擎里对有效知识沙里淘金的筛选过程相区别。 “未来的创新试验将越来越倚重于科学数据的规范复用,以及通过数据挖掘、集成、分析与可视化工具将其转换为信息和知识的能力。” -第77届国际图联大会报告 “图书馆应该注意到“阅读”本身的变化,人们在“zooming”从一个内容跳跃到另外一个内容,让思维跳跃在信息的海洋上,以便跟上信息爆炸的速度。” - 张晓林 “超越图书馆”,2011年11月 国内信息服务商,第一家支持Openurl协议(2003年) 率先加入Google Scholar项目(2004年) 第一家支持唯一标识符开放链接,CBMdisc系统全文链接(2004年) 最早加入西文发现系统的中文合作Primo\Summon\EDS(2010年) 计划推动中文发现与西文发现的整合,从本体对象层面实现整合对接合作。支持图书馆实现中文平台和西文平台的再整合。 资源组织架构图(含特色资源、第三方节点、科学数据管理) 公有云与私有云 智立方既可直接使用,也可以助推图书馆的二次开发及相关应用,从资源技术的驱动层面,解决图书馆员的汇编服务工作 智立方可以帮助客户快速建立专题图书馆、学科图书馆 、OPAC导航增强为知识点导航。把大而全的资源优势转化为精细情报、决策支持优势 企业对政策解读、项目申报、产学研上下游需要直观的结构归纳认识;竞争情报基于文献,但高于文献 在智立方平台的基础上,维普也建立了实体的情报跟踪分析团队,来满足面向社会的产业情报个性化服务需求 智立方平台已经完成了公开文献的知识管理组织,通过智立方的平台,把图书馆的信息资源优势,转换为管理决策信息支持优势。助推学科评估、人才评估工作; 组织内部非公开资料,以及科学数据的管理,面向业务需求的知识重组。图书馆是最佳衔接环节。馆员是最佳实践人员; 对内部知识管理,维普可以提供平台技术的保障,帮助图书馆从重点学科、重点产业的服务开始推进。帮助图书馆完成内外部知识管理的整合。为读者提供更加强大的服务; 图书馆的信息深度服务应该与搜索引擎广度服务有很大的不同,web scale discovery和搜索引擎比广度的发展方向没有出路。 发现平台不仅是要帮助图书馆解决“藏”的问题,根源需求是要帮助读者解决“用”的问题,智立方平台的体验是您更好的选择。 平台选型不仅是选择产品,更是选择长久的合作伙伴! 智立方云平台试用服务已经开通,请联系销售经理参与体验反馈

文档评论(0)

四娘 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档