大数据挖掘要点详解.pptVIP

  • 2
  • 0
  • 约1.34千字
  • 约 12页
  • 2016-04-24 发布于湖北
  • 举报
Ethink数据挖掘特点 数据挖掘是从大型数据集中发现可行信息的过程。数据挖掘使用数学分析来派生存在于数据中的模式和趋势。 ETHINK大数据挖掘是国内第一家基于大数据和云计算的数据挖掘工具,通过分布式内存弹性计算引擎,解决大数据相关的挖掘问题,比如用户画像、客户流失预警、客户行为分析、收入预测、故障预警、风险分析、互联网用户日志分析、股票交易监测、信用卡欺诈报警、基因序列分析、移动用户离网预测、企业内部员工电子邮件检测、黑客入侵报警、网游外挂识别、热点问题舆情分析、交通流量预测等。 ETHINK大数据挖掘支持WEB在线可视化开发。整个挖掘流程,从数据集成、数据规范,到模型训练、模型评估、模型部署,都可以在线配置,每步运行都可以在控制台上监控信息,控制灵活,具有高度的动态性。 ETHINK大数据挖掘操作简单,让你瞬间成为公司顶级大数据分析专家、数据挖掘专家。无论是复杂的统计分析,还是高深的挖掘算法,你都不需要编程,通过界面化配置,轻松完成分析工作。 ETHINK大数据挖掘采用弹性分布式的数据集,允许在大型集群上执行基于内存的计算。将数据保存在内存中能够极大地提高性能,我们实现的迭代计算方面比Hadoop快二十多倍,同时还可以在5-7秒的延时内交互式地查询1TB的数据集。 ETHINK大数据挖掘实现了非常丰富的数据接口,用于从不同的数据源抽取数据,以便进行统一的整合和分析。使用ETHINK大数据挖掘,您可以从几乎所有的主流数据库中提取数据,包括关系型数据库如SQL Server、Oracle、DB2、Informix、My SQL、Teradata、PostgreSQL 等;大数据数据库如Hadoop、Hbase 、MongoDB、Cassandra、Imala等。 您也可以非常轻易地导入文档型数据,包括CSV、XML、JSON等。 数据挖掘过程中数据的质量、数量等各种问题使得该过程平均有75%以上的时间花费在数据预处理阶段,ETHINK大数据挖掘平台提供多种数据处理节点,分析人员可以通过拖拉的方式实现数据的预处理,而不需要精通数据库语言。 ETHINK大数据挖掘集成了R语言算法,支持分布检验、均值向量与协方差阵的假设检验、方差分析、回归分析、判别分析、聚类分析、多因子分析、线性规划与整数规划、动态规划、不确定型决策和风险型决策等方面的内容。 ETHINK大数据挖掘支持所有主流的数据挖掘/知识发现算法,如关联规则、决策树、神经网络、支持向量机、KMeans、关联规则等。支持所有主流的数据挖掘/知识发现算法,如关联规则、决策树、神经网络、支持向量机、KMeans、关联规则等。 ETHINK大数据挖掘平台提供了多种图形化技术,帮助理解数据间的关键性联系,并指导以最便捷的途径找到问题的最终解决办法。ETHINK大数据挖掘平台融合了3D、图形和动画等多种可视化技术来处理多维数据,使得数据所表现出的特征、模式和关联性等信息一目了然,可以生成散点图、分布图、直方图、堆积图、多重散点图、网络图等。 ETHINK大数据挖掘提供事件预警通知功能,数据挖掘结果可以周期性调度形成预警分析,并将任务推送到待办用户,实现工作任务流转处理。 Ethink平台官网

文档评论(0)

1亿VIP精品文档

相关文档