塔布DMP大数据平台操作手册.pdf

  1. 1、本文档共18页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
塔布DMP大数据平台操作手册

1 / 18 塔布 DMP 大数据平台操作手册 行业领先的企业大数据提供商 2 / 18 目录 塔布 DMP 大数据平台操作手册 1 1. 塔布平台体系架构4 1.1 平台总览4 1.1.1 企业大数据应用金字塔4 1.1.2 数据增值与变现探索5 1.1.3 塔布大数据平台体系结构5 1.1.4 塔布大数据平台核心功能点6 1.1.5 塔布丰富的三方数据来源7 1.2 塔布 DMP 平台关键技术 7 1.2.1 全网数据采集7 1.2.2 海量计算7 1.2.3 语义分析8 1.2.4 用户画像8 2. 塔布 DMP 平台主要功能点 8 2.1 仪表盘9 2.1.1 数据资产展示10 2.1.2 用户画像11 2.2 数据整合12 3 / 18 2.3 数据管理13 2.4 数据分析功能13 2.5 应用中心18 4 / 18 1. 塔布平台体系架构 塔布数据致力于为企业提供专业的数据挖掘、管理、分析、经营的专业 DMP 平台。 我们通过长期的研发投入,积累了丰富的数据处理经验,研发出具有自有知识产权的一 系列技术,以适应数据市场的发展,以满足不同行业、不同领域对于大数据平台的需求, 最大幅度的提升数据对企业发展的价值,为企业的变革提供了强有力的基石。 1.1 平台总览 1.1.1 企业大数据应用金字塔 5 / 18 1.1.2 数据增值与变现探索 1.1.3 塔布大数据平台体系结构 对于 DMP 平台,塔布数据有科学强健的架构体系,引入多种具有自主产权的组件: 6 / 18 1.1.4 塔布大数据平台核心功能点 7 / 18 1.1.5 塔布丰富的三方数据来源 1.2 塔布 DMP 平台关键技术 塔布大数据在数据的采集、存储、分析、应用各环节,特别在非结构化数据的语义 计算上,积累了丰富的数据处理经验,研发出自有知识产权的一系列技术与核心组件, 应用于全网数据采集、海量数据计算、高智能语义分析、精准的用户画像等多个功能点。 1.2.1 全网数据采集 我们采用了先进的数据采集技术:包括分布式爬虫,具备可扩展性,配置了基于 Spark/Redis 实现实时数据抓取,数据具有时效性。采用内嵌代理IP 服务,避免网站 屏蔽,持续稳定抓取,并且内嵌自动数据抽取算法。系统支持多租户/多实例模式。 1.2.2 海量计算 塔布自主研发了海量计算平台——BUFFALO+OWL ,支持复杂的工作流调度以及 8 / 18 任务优先级管理,我们支持以插件方式支持企业复杂的业务逻辑,并且兼容主流的分布 式计算框架(MapReduce/Storm/Spark )。系统隔离了底层的应用框架和上层应用逻 辑,将来易于技术升级。 1.2.3 语义分析 塔布语义分析采用了具有自主研发的高智能语义分析组件 Hornbill ,可以实现关 建词抽取、实体识别、内容分类、内容聚类、内容摘要、观点抽取等功能,在观点抽取, 我们具有三元组观点抽取专利 :对象,特征,情感。 1.2.4 用户画像 塔布数据通过长期多行业的积累,具备有丰富的标签体系,可以提供用户需求的 精准画像,采用深度学习的方法,提高标签推荐的准确性,便于营销策划和挖掘标签关 系。支持对客户群实时受众分析,基于自有细分标签体系提供多维用户洞

文档评论(0)

yaocen + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档