- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE 1
PAGE \* ArabicDash - 1 -
中国通信工业协会
物联网应用分会
通协分字〔2016〕第30号
关于举办全国高校python数据挖掘与机器学习研讨会暨网络爬虫与文本挖掘技术培训班的通知
各有关单位:
在大数据时代,在商业、经济及其他领域中基于数据和分析去发现问题并作出科学客观的决策越来越重要;python是一种面向对象直译式计算机程序设计语言,也是一种功能强大的通用型语言,近几年已经成为最受欢迎的动态编程语言之一,被越来越多的科研人员用来处理实验数据、制作图表及开发科学计算应用程序,采用Python做科学计算的研究机构日益增多,Python逐渐被认为是学习和实现机器学习技术最好的语言之一,Python是美国大学计算机科学系入门课程最受欢迎的编程语言,计算机科学系Top10中有8家在入门课程中教授Python,包括卡耐基、麻省理工学院在内的国外很多高校,都已经选用Python作为教学语言。
为了协助国内高校在教学领域培养一批Python专业师资,满足行业对python数据处理相关高端人才的迫切需求,我单位将于近期举办“全国高校python数据挖掘与机器学习研讨会暨网络爬虫与文本挖掘培训班”,具体安排详见附件。
中国通信工业协会物联网应用分会
2016年11月28日
附件:
一、培训对象
各高校计算机科学、软件、信息管理与信息系统、统计、数学、金融、工商管理、电子商务、市场营销等相关专业负责人和骨干老师、高年级本科生及研究生,银行、电信、电子商务运营、互联网、金融保险等行业从事数据挖掘与分析的技术及管理人员。
二、培训目标
1,让学员尽快掌握python语言的基本结构与语法与数据类型,模块、基本用法,熟悉函数,类设计,包的使用及基本的编程方法;
2,理解python数据挖掘与分析技术在当代各种大数据相关产品中的应用,并掌握该领域最关键技术的原理以及技术应用过程;
3,能开发出一些实际的应用项目并初步胜任Python的数据挖掘和机器学习工作;
4,通过紧密结合应用实例,针对工作中存在的疑难问题进行分析讲解和专题讨论,进而有效提升学员解决科研及教学中实际问题的能力同时提升其从数据角度去思考的能力;
三、培训特点
培训采用全案例教学模式,通过理论知识+案例示范+练习,突出软件学习的应用性,从应用案例入手讲解知识点,既用简洁易懂的语言讲述理论方法,又同时进行实际数据挖掘分析演示;不仅仅适合零基础的初学者,同时也适合经验较为丰富的操作者;学员可以事先提供自己在工作学习中遇到的python问题,课程中会选择有代表性的问题进行分析与探讨;该课程可以保证学员直接进入处理实际问题的状态,灵活的运用课程所讲的方法和程序处理实际问题;提供全部教学课件、源代码、编程操作步骤,建立与授课专家的长期的答疑联系。
四、教学大纲
A模块(python数据挖掘与分析技术)
第一天
第1讲:数据分析方法概述及相关工具
1.认识数据
2.数据分析的步骤和原则(确定/分解/评估/决策)
3.相关工具概述及对比(excel/spss/R/matlab/python/Java)
第2讲:python环境和基础语法与
1.安装anaconda套件
2.基本数据结构(列表/字符串/字典)
3.基本语法(条件/循环/函数/类/模块)
4.python语言编程的最佳实践经验
5.python在业界的应用案例分享
第3讲:基础工具库
1.基础环境linux/ipython
2.数值计算 numpy
3.绘图与可视化 matplotlib与 Chart
4.数据操作 pandas
5.高级应用案例分享
第二天
第4讲:统计分析库
1.概率和统计分析 statsmodels
2.科学计算和最优化 scipy
3.线性回归和逻辑回归 statsmodels
第5讲:数据挖掘概览
1.数据挖掘与模型
2.建模流程和步骤
3.常见算法
5.高级应用案例解析
第6讲:典型数据挖掘项目示范
1.基于titanic数据集预测生存概率
2.演示如何进行绘图探索
3.特征处理和建模
4.练习及答疑
第三天
第7讲:数据挖掘与机器学习
1.感知机
2决策树
3.特征工程
4.正则化方法
5. PCA
6.练习和答疑
第8讲:机器学习进阶
1.参数调优
2.集成学习
3.文本挖掘
4.神经网络
5.深度学习
第9讲:数据挖掘案例讲解
1.基于MNIST数据集识别数字
2.展示如何进行特征构造
3.常规机器学习算法和深度学习算法的效果差异
4.机器学习的结果评估
5.深度学习的最新进展分享
6.练习和答疑
第10讲:现代分析技术的应用
1.社交网络分析
2.空间数据的展示与地理信息分析
3.
文档评论(0)