简历模板大数据开发工程师-3年.docxVIP

下载本文档

113
0
约4.54千字
约 6页
2022-01-17 发布于陕西
举报
版权申诉

简历模板大数据开发工程师-3年.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

大数据开发工程师个人简历 ———————————————————————————————————— 个人概况姓名：XXX 籍贯：河南性别：男工作年限： 4年年龄：28 学历：本科联系方式：XXXXXXXX E -- mail: XXXXXX@163.com —————————————————————————————————————————— 求职意向目标职能：大数据开发工程师工作性质：全职目标地点：北京到岗时间：即时 —————————————————————————————————————————— 工作经验工作单位：XXXXXXXX集团股份有限公司工作日期：2016.8 – 2019.2 工作职位：大数据开发工程师工作日期：2015.3 – 2016.8 工作职位：Java开发工程师 —————————————————————————————————————————— 专业技能 1、熟练使用SparkCore RDD算子处理数据，熟悉Spark任务提交流程。 2、熟练使用SparkSql查询数据，自定义UDF，熟练使用Spark Streaming处理实时数据，熟悉DataSet、DataFream、Rdd三者之间的转化。 3、熟练使用Mapreduce处理复杂业务，熟悉HDFS的读写流程，熟悉Mapreduce的shuffle过程及优化，熟悉shuffle过程的优化手段和Hadoop集群搭建。 4、熟悉Zookeeper的选举机制和监听机制。 5、熟悉Hive架构，使用窗口函数和自定义UDF处理数据，熟悉Hive优化策略。 6、熟练使用Flume工具完成日志的采集过滤和分类，使用Ganglia监控工具。 7、熟练使用Kafka高低阶API消费数据，熟悉KafkaOffsetManager监控工具。 8、熟练使用Elasticsearch创建索引，利用API批量保存数据，使用Kibina查询es索引。 9、熟悉Mysql，Mongodb，Redis数据库的使用。 10、熟练使用Sqoop把Hive表数据从HDFS导入到Mysql数据库。 11、熟练掌握常用的Linux命令，使用Shell命令编写Shell脚本，Azkaban完成定时调度。 12、熟练用IDEA, Eclipse, Gitlab，SVN，Maven，Xshell开发工具。项目经验项目一：西瓜籽APP实时分析开发时间： 2018.05-2019.02 开发环境： IDEA + Maven + GitLab + SQLyog + Xshell + ClouderManager 系统架构： Spark Streaming + Hive + Hadoop+ Kafka+ Redis + Elasticsearch + Mysql + Scala 项目描述：西瓜籽是网智天元旗下集影视资讯、电影推荐、粉圈互动、电影评分、明星同款商城等多功能为一体的app，旨在发现粉丝用户的观影行为，引导粉丝消费；利用大数据平台对用户行为进行统计分析，发展粉丝经济。责任描述：参与项目需求讨论与架构分析。实时统计当前活跃用户。实时统计当前新增用户。实时统计当前签到用户。实时统计当前用户下单量。实时统计当前商品交易总额。实时统计电影综合评分。技术描述：使用双层Flume架构收集用户日志，分为浏览行为、点击行为、评分行为。使用Kafka实时读取Flume收集的日志信息，存入各个topic分区中。使用Canal工具监控Mysql中订单表，影评表的变化，将增量数据推送到Kafka中。使用Spark Streaming消费Kafka队列的数据，手动维护offset。使用Spark RDD的map、groupByKey、reduceByKey、foreachRDD、foreachPartition等算子处理消费的数据，分别对订单和影评中的敏感数据进行脱敏、过滤和屏蔽。使用Redis的Set集合对用户的DAU进行缓存和去重，从Redis中取出缓存数据，利用broadcast广播变量分发到各个executor。使用Spark Streaming把订单、影评等数据保存到Elasticsearch，使用IK分词器分词，建立倒排索引，方便模糊查询。使用ES的API编写查询接口，可以实时查询订