值得mark的11个开源机器学习项目.docxVIP

下载本文档

0
0
约1.64千字
约 5页
2018-12-19 发布于贵州
举报
版权申诉

值得mark的11个开源机器学习项目.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

值得mark的11个开源机器学习项目

协力泽仁值得mark的11个开源机器学习项目垃圾邮件过滤、人脸识别、推荐引擎——当你有一个大数据集并且希望利用它们执行预测分析和模式识别，机器学习是必经之路。这门科学，计算机可以在没有事先规划的前提下自主学习、分析和操作数据，现在越来越多的开发人员关注机器学习。机器学习技术的兴起不仅是因为硬件成本越来越便宜以及性能越来越强大，促使机器学习在单机或大规模集群上轻松部署的免费软件激增也是重要因素。机器学习库的多样性意味着无论你喜欢什么语言或环境，都有可能是获得你喜欢的。 1. Scikit-learn Python由于其易用性以及丰富的函数库，已经成为数学、自然科学和统计学的首选编程语言。Scikit-learn通过在现有Python包上构建——NumPy SciPy和matplotlib——服务于数学和自然科学。生成的库要么可以使用交互式“工作台”应用程序，要么被嵌入到其他软件和重用。工具箱可以在BSD许可下获取，所以它是完全开放和可重用的。 Project: HYPERLINK /stable/ scikit-learn GitHub: HYPERLINK /scikit-learn/scikit-learn /scikit-learn/scikit-learn 2. Shogun 在最古老、最值得尊敬的机器学习库中，Shogun创建于1999年，用C++编写，但并不限于在C++工作。由于SWIG库，Shogun可以轻松在Java、Python、C#、Ruby、R、Lua、Octave、Matlab语言和环境下使用。虽然德高望重，Shogun也有其他的竞争者。另一个基于C++的机器学习库Mlpack在2011年出现，它宣称比其他竞争者速度更快并且更容易使用（一个更完整的API集）。 Project: HYPERLINK / Shogun GitHub: HYPERLINK /shogun-toolbox/shogun /shogun-toolbox/shogun 3. Accord Framework/AF Accord，一个.Net的机器学习和信号处理框架，是早前类似一个项目AF的扩展。顺便说一下，“信号处理”这里是指一系列对图像和音频的机器学习算法，如图片无缝缝合或执行人脸检测。包含一组视觉处理算法；它作用于图像流（如视频），并且可用于实现移动对象的跟踪等功能。Accord还提供一个从神经网络到决策树系统的机器学习常见库。 Project: HYPERLINK / Accord Framework/AF GitHub: HYPERLINK /accord-net/framework/ /accord-net/framework/ 4. Mahout Mahout框架一直与Hadoop相关联，但旗下很多算法还可以脱离Hadoop运行。他们对那些可能最终迁移到Hadoop上的应用程序或从Hadoop上剥离成为独立应用程序的项目非常有用。 Mahout缺点之一：目前几乎没有算法支持高性能的Spark框架，反而使用日益过时的MapReduce框架。该项目目前不接受基于MapReduce的算法，那些想要获得更高性能的开发者转而用MLlib 替代。 Project: HYPERLINK / Mahout 5. MLlib Apache自己的Spark和Hadoop机器学习库，旨在为大规模和高速度而设计的MLlib自称拥有所有常见的算法和有用数据类型。与任何Hadoop项目一样，Java是MLlib上的基本语言，但是Python用户可以用MLlib NumPy库连接（也用于scikit-learn），并且Scala用户可以针对MLlib编写代码。如果不能设置一个Hadoop集群，MLlib可以在没有Hadoop的情况下部署在Spark上——以及在EC2或Mesos上。