- 1、本文档共28页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
人工智能大数据分析平台面向企业级用户的一体化大数据分析应用平台
1.2.3.目录CONCENTS产品介绍产品优势产品案例
自助式分析结论深度不足,业务专家被统计学、算法拒之门外一体化过多的工具,呈碎片化,带来了巨大的学习成本与部署成本企业级分析的结论,仅仅停留在了报告层面,没有固化推广,成为新的知识与经验不能满足复杂的企业级应用工具的使用门槛高工具碎片化程度高
面向企业级全民用户的|一体化大数据分析应用平台数据应用数据源
数据分析分布式算法库(Scala)基础算法库(Java\Python\R)挖掘流程机(MPM)应用服务层(Java,Html5,JS)数据接入接口服务HDFSAPI,HbaseAPI,webservice日志文件Flume消息队列JMS、Kafka数据存储分布式文件系统HDFS列式数据库HBase分布式数据仓库Hive关系数据库Oracle/MySQL数据计算分布式查询服务Hive、Impala、Presto、drill分布式并行计算Spark、MapReduceTensorflowOnSparkZOOKEEPERANGLIA资源管理YARN资源 资源协作 监控G数据库Sqoop预处理算法自然语言处理自动择参特征工程深度学习自动学习统计分析机器学习
聚类、分类、回归、时间序列、关联、推荐、评价、NLP等分布式算法模型对模型的效果和性能进行评估,主要是理论检验和实践验证。将模型固化应用在实际系统和流程中,从而实现业务数据生产价值。Excel、Teradata、Oracle、HDFS、GP、HBASE、HIVE等20余种类型用户通过抽样、升降维、连接等操作实现数据高级转换,完成特征工程构造。
自动化、智能化模型构建和评估灵活的流程设计模型评估实现自动选取性能最好的算法模型交叉验证衡量参数设置下的预测效果自动择参实现自动选取最优模型类型和参数变量选择实现自动选取最优属性子集自动分类实现多种模型的最优模型推荐循环实现批量处理和差异化建模拖拽式、可视化操作,无需编码,简单操作即可分析出想要的结果子进程完成复杂流程的嵌套多分支实现同样数据的多分支流向参数实现流程的设计和控制
利用分布式环境中强大的数据操作和处理功能,用户可按照行、列、表等类型操作,进行数据类型变换、缺失值处理、数据抽样、数据连接和属性衍生,实现特征工程构造。同时,平台支持主成分等高级功能为大数据集进行属性降维,为后续的机器学习算法准备分析数据。
涵盖描述数据统计、直方图、相关分析、典型相关分析、偏相关分析、方差分析、P-P图、Q-Q图以及相似度等统计方法和图表。用户基于这些统计方法进行交互数据分析,掌握数据的分布特征。行业重要突增突降业务重大异常变动监测分析小微、小区战略方向分析行业重要战略性指标趋势分析(发电量、用电量等)业务分布区域分析(标杆支行、明星业务)重点大客户/行业结构分析风险管理统计
时间序列业务指标未来发展规律、变化趋势预测(趋势性、季节周期性、扰动性)聚类市场细分、客户画像、精准营销高价值客户和长尾客户的标签体系分类/回归小额授贷、流失预警等综合评价业务督导、绩效考核、客户综合价值评价各个业务机构排名/流程审批效率对比关联/推荐客户需求判断、产品相关性分析、产品交叉营销、捆绑销售等涵盖聚类、分类、回归、自然语言处理、时间序列、关联、综合评价、推荐等8大类机器学习算法。用户基于这些算法构建模型,对模型的表现进行评分,从而开展深度数据分析,发掘蕴藏在业务数据中价值。自然语言处理舆情分析、情感分析、主旨话题分析、特定信息抽取
算法类别分类算法回归算法算法逻辑回归分类、朴素贝叶斯、XGBoost分类、贝叶斯网络分类、神经网络分类、随机森林分类、支持向量机分类、CART、ID3分类、C45+决策树分类、梯度提升树分类、L1/2稀疏迭代分类、RBF神经网络分类、KNN、线性判别分类、Adboost分类、Bagging分类算法、DNN分类等线性回归、决策树回归、SVM回归、梯度提升数回归、BP神经网络回归、保序回归、曲线回归、随机森林回归、L1/2稀疏迭代回归、Bagging回归算法、DNN回归、LSTM回归等聚类算法KMeans、模糊C均值、EM聚类、Hierarchy、Kohonen聚类、视觉聚类、Canopy、幂迭代等关联规则/推荐算法Apriori、FPGrowth、序列、协同过滤等时间序列算法ARIMA、稀疏时间序列、指数平滑、移动平均、向量自回归、X11、X12等综合评价算法熵值法、TOPSIS、层次分析法、模糊综合评价法等自
文档评论(0)