数据挖掘实战3实验环境垃圾邮件检测美国社区犯罪率预测.pptx

数据挖掘实战3实验环境垃圾邮件检测美国社区犯罪率预测.pptx

数据挖掘实战实验环境垃圾邮件检测美国社区犯罪率预测实验环境Python 2.7.xIPythonNumPyMatplotlibAnacondaPython优秀的通用语言杰出的“胶水”语言动态执行语言垃圾回收大范围的标准库完整的开发工具链强大的用户社区完全免费NumPyMatplotlibIPythonPython VS 传统通用语言Python最主要的缺陷在于性能C/C++可以取得非常高的性能…但是要付出非常高的代价C/C++有陡峭的学习曲线和开发成本Java同样难于学习,开发成本较高,硬件成本高于C/C++在程序的关键部分可以利用Python的整合能力极大地提高性能为什么不使用R/Matlab在机器学习/大数据领域,R/Matlab/Python日益成为最受关注的三驾马车R提供了强大的统计学能力,但是并非通用语言,学习曲线陡峭Matlab提供了可依赖的商用计算环境,但是同样并非通用语言,且价格昂贵丰富的Python算法库SciPyScikit-learnGensimNLTKMILKOrangeShogun垃圾邮件检测问题定义算法分析数据预处理特征提取模型训练模型实验回顾问题定义目标预期输出数据垃圾邮件正式定义:凡是未经用户许可就强行发送到用户的邮箱中的任何电子邮件都可称作是垃圾邮件。赚钱信息、成人广告、商业广告、网站推广、电子杂志、连环信对策手工处理费时费力规则过滤无法穷举规则智

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档