- 1、本文档共18页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
塔布DMP大数据平台操作手册
1 / 18
塔布 DMP 大数据平台操作手册
行业领先的企业大数据提供商
2 / 18
目录
塔布 DMP 大数据平台操作手册 1
1. 塔布平台体系架构4
1.1 平台总览4
1.1.1 企业大数据应用金字塔4
1.1.2 数据增值与变现探索5
1.1.3 塔布大数据平台体系结构5
1.1.4 塔布大数据平台核心功能点6
1.1.5 塔布丰富的三方数据来源7
1.2 塔布 DMP 平台关键技术 7
1.2.1 全网数据采集7
1.2.2 海量计算7
1.2.3 语义分析8
1.2.4 用户画像8
2. 塔布 DMP 平台主要功能点 8
2.1 仪表盘9
2.1.1 数据资产展示10
2.1.2 用户画像11
2.2 数据整合12
3 / 18
2.3 数据管理13
2.4 数据分析功能13
2.5 应用中心18
4 / 18
1. 塔布平台体系架构
塔布数据致力于为企业提供专业的数据挖掘、管理、分析、经营的专业 DMP 平台。
我们通过长期的研发投入,积累了丰富的数据处理经验,研发出具有自有知识产权的一
系列技术,以适应数据市场的发展,以满足不同行业、不同领域对于大数据平台的需求,
最大幅度的提升数据对企业发展的价值,为企业的变革提供了强有力的基石。
1.1 平台总览
1.1.1 企业大数据应用金字塔
5 / 18
1.1.2 数据增值与变现探索
1.1.3 塔布大数据平台体系结构
对于 DMP 平台,塔布数据有科学强健的架构体系,引入多种具有自主产权的组件:
6 / 18
1.1.4 塔布大数据平台核心功能点
7 / 18
1.1.5 塔布丰富的三方数据来源
1.2 塔布 DMP 平台关键技术
塔布大数据在数据的采集、存储、分析、应用各环节,特别在非结构化数据的语义
计算上,积累了丰富的数据处理经验,研发出自有知识产权的一系列技术与核心组件,
应用于全网数据采集、海量数据计算、高智能语义分析、精准的用户画像等多个功能点。
1.2.1 全网数据采集
我们采用了先进的数据采集技术:包括分布式爬虫,具备可扩展性,配置了基于
Spark/Redis 实现实时数据抓取,数据具有时效性。采用内嵌代理IP 服务,避免网站
屏蔽,持续稳定抓取,并且内嵌自动数据抽取算法。系统支持多租户/多实例模式。
1.2.2 海量计算
塔布自主研发了海量计算平台——BUFFALO+OWL ,支持复杂的工作流调度以及
8 / 18
任务优先级管理,我们支持以插件方式支持企业复杂的业务逻辑,并且兼容主流的分布
式计算框架(MapReduce/Storm/Spark )。系统隔离了底层的应用框架和上层应用逻
辑,将来易于技术升级。
1.2.3 语义分析
塔布语义分析采用了具有自主研发的高智能语义分析组件 Hornbill ,可以实现关
建词抽取、实体识别、内容分类、内容聚类、内容摘要、观点抽取等功能,在观点抽取,
我们具有三元组观点抽取专利 :对象,特征,情感。
1.2.4 用户画像
塔布数据通过长期多行业的积累,具备有丰富的标签体系,可以提供用户需求的
精准画像,采用深度学习的方法,提高标签推荐的准确性,便于营销策划和挖掘标签关
系。支持对客户群实时受众分析,基于自有细分标签体系提供多维用户洞
文档评论(0)