大数据开发工程师简历模板.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
求职目标:大数据开发工程师历简人个 求职目标:大数据开发工程师 历 简 人 个 基本信息 基本信息 姓 名:XX 性 别:男 工作经验:3年 联系电话:1XXXX 电子邮件:XXXXXX0@163.com 毕业院校:XX电力大学 专 业:数学与应用数学 英语水平:CET-6 获奖证书:全国数学建模竞赛二等奖 求职意向 求职意向 工作性质:全职 目标地点:北京 目标职能:大数据开发工程师 目标薪资:面议 工作经历 工作经历 单位名称:XXXXXX科技有限公司 职位名称:大数据开发工程师 工作时间:2016.8-2019.2 专业技能 专业技能 1. 熟练掌握Java、Scala编程语言,拥有良好的编码习惯,理解面向对象编程和函数式编程思想 2. 熟练掌握Hadoop技术,HDFS、MapReduce、YARN的工作机制,有调优经验,能搭建Hadoop集群 3. 熟练掌握Hive数仓建设,熟练使用HQL进行企业级开发,有Hive调优经验 4. 熟悉分布式应用程序协调服务Zookeeper,理解Zookeeper的Paxos选举机制 5. 熟练使用Flume进行日志采集,会自定义Flume拦截器,了解Flume组成架构, 6. 熟悉使用Kafka实现消费数据,理解高吞吐量机制,掌握Kafka高低级API的编写 7. 熟练使用SparkCore、SparkSQL、Spark Streaming编程,理解Spark内核,任务提交,执行流程,Shuffle 机制、熟悉Spark调优 8. 熟练使用Sqoop在HDFS和Mysql数据库之间传递数据 9. 能够使用ElasticSearch进行海量数据存储和检索 10. 熟练使用Mysql,能够使用SQL对数据进行增删改查操作 11. 熟练使用Git、Maven等项目版本控制和自动化构建工具 12. 熟练使用 Hbase,熟练使用其 JavaAPI 进行程序开发,熟悉 Hbase的结构原理区和 Rowkey设计 13. 熟悉Azkaban,能够使用Azkaban进行任务调度 14. 熟悉推荐系统,对机器学习有浓厚兴趣,了解常用算法 项目经验 项目经验 项目名称:快看影视大全推荐系统 软件架构: Nginx +Flume + HDFS + Spark + Hive + Mysql +Sqoop + Azkaban +Hadoop 开发环境:IDEA+JDK1.8+Git+MAVEN+Scala 项目描述: 本电影推荐系统是为了提高用户体验,从App海量的电影中推荐出用户感兴趣的电影。系统包含了离线推荐与实时推荐体系,综合利用了协同过滤算法以及基于内容的推荐方法来提供混合推荐。提供了从前端应用、后台服务、算法设计实现、平台部署等多方位的闭环的业务实现。 责任描述: 参与项目推荐算法的确定和框架搭建 负责模型参数的评估和选取 负责离线统计推荐指标的分析 负责实时推荐的余弦相似度和对数增减因子的确定 技术要点: 使用Flume完成日志数据的采集工作,解决Flume落盘HDFS产生大量小文件问题 基于SparkSQL,分析了离线统计推荐指标:历史热门推荐,近期热门推荐,优质电影推荐 用ALS算法求解模型,构建userProducts矩阵,预测出电影评分 对模型的参数(rank,iteratons,lambda)进行评估,选取最合适的参数值 基于Azkaban实现对于离线统计服务和离线推荐服务的调度 获取电影特征矩阵,计算出余弦相似度,进一步求出电影相似度(只取相似度0.65) 基于 SprakStreaming + Kafka + Redis,结合余弦相似度和调整因子,计算推荐优先级 项目经验 项目经验 项目名称:快看影视数仓业务分析系统 软件架构:Nginx +Flume + HDFS + Spark + Hive + Mysql +Sqoop + Azkaban +Hadoop 开发环境:IDEA+JDK1.8+Git+MAVEN+Scala 项目描述: ?数据仓库是根据随着时间发生变化的数据集成到面向主题的平台,通过该平台可以提取出对企业管理层决策提供重要依据的数据,利于企业长远发展。本项目收集了用户基本信息、设备信息、用户交易、订单等数据,经过数仓逐层分析根据需求分析得到不同的统计数据。主要分为日志采集、数仓搭建、离线统计、数据展示四大模块。 责任描述: 负责用户产品日志的收集 参入数仓架构设计,负责项目数据仓库的建设 负责离线数据分析,制作符合业务需求的报表。 技术要点: 设计Flume双层结构,自定义Flume拦截器,实现日志分流 基于Hive数,参与数据仓库搭建,设

文档评论(0)

文廊 + 关注
实名认证
文档贡献者

一名基层工作者的社会实践,与同行者分享。

1亿VIP精品文档

相关文档