您现在的位置是：首页 > 硬件

当前栏目

盘点四大民间机器学习开源框架

机器开源学习框架盘点四大

2023-09-27 14:21:21 时间

Theano 在深度学习框架中是祖师级的存在。它的开发始于 2007，早期开发者包括传奇人物 Yoshua Bengio 和 Ian Goodfellow。

Theano 基于 Python，是一个擅长处理多维数组的库（这方面它类似于 NumPy）。当与其他深度学习库结合起来，它十分适合数据探索。它为执行深度学习中大规模神经网络算法的运算所设计。其实，它可以被更好地理解为一个数学表达式的编译器：用符号式语言定义你想要的结果，该框架会对你的程序进行编译，来高效运行于 GPU 或 CPU。

它与后来出现的 Tensorflow 功能十分相似（或者应该说，Tensorflow 类似 Theano ），因而两者常常被放在一起比较。它们本身都偏底层，同样的，Theano 像是一个研究平台多过是一个深度学习库。你需要从底层开始做许多工作，来创建你需要的模型。比方说，Theano 没有神经网络的分级。

但随着这些年的发展，大量基于 Theano 的开源深度学习库被开发出来，包括 Keras, Lasagne 和 Blocks。这些更高层级的 wrapper API，能大幅减少开发时间以及过程中的麻烦。甚至，据雷锋网(公众号：雷锋网)所知，很少开发者会使用“裸奔”的 Theano，多数人需要辅助的 API。顺便说一句，Theano 是一整套生态系统，别只用它裸奔，然后抱怨不好用。

在过去的很长一段时间内，Theano 是深度学习开发与研究的行业标准。而且，由于出身学界，它最初是为学术研究而设计，这导致深度学习领域的许多学者至今仍在使用 Theano。但随着 Tensorflow 在谷歌的支持下强势崛起，Theano 日渐式微，使用的人越来越少。这过程中的标志性事件是：创始者之一的 Ian Goodfellow 放弃 Theano 转去谷歌开发 Tensorflow。

因此，资深一些的开发者往往认为，对于深度学习新手，用Theano 练练手并没有任何坏处。但对于职业开发者，还是建议用 Tensorflow。

这又是一个祖师级的深度学习框架，2013 年就已问世。

它的全称是 “Convolution Architecture For Feature Extraction”，意为“用于特征提取的卷积架构”，很明白地体现了它的用途。Caffe 的创始人，是加州大学伯克利分校的中国籍博士生贾扬清。当时贾在伯克利计算机视觉与学习中心做研究。博士毕业后，他先后在谷歌和 Facebook 工作。

在 AI 开发者圈子中，Caffe 可以说是无人不知、无人不晓。据 GitHub 最新的机器学习项目热度排名，Caffe 仅位列 Tensorflow 之后，雄踞第二。它是一个被广泛使用的机器视觉库，把 Matlab 执行快速卷积网络的方式带到 C 和 C++。虽然 Caffe 被部分开发者看做是通用框架，但它的设计初衷是计算机视觉——并不适于其他深度学习应用，比如文字、语音识别和处理时间序列数据。

Caffe 的主要用途：利用卷积神经网络进行图像分类。这方面它代表了业内一流水平，是开发者的首选。

说到 Caffe，就不得不提 Model Zoo。后者是在 Caffe 基础上开发出的一系列模型的汇聚之地。因此，开发者使用 Caffe 最大的好处是：能在 Model Zoo 海量的、事先训练好的神经网络中，选择贴近自己使用需求的直接下载，并立刻就能用。

就雷锋网所知，这些模型中有很多是世界一流的。有很多它们的教程：

业内人士普遍认为，Caffe 适合于以实现基础算法为主要目的的工业应用，有利于快速开发。但对于处理较特殊的任务，它存在灵活性不足的问题——为模型做调整常常需要用 C++ 和 CUDA，虽然 Python 和 Matlab 也能做些小调整。

3. Torch

相比其他开源框架，Torch 是一个非主流。

没错，说的就是它的开发语言：基于1990 年代诞生于巴西的 Lua，而非机器学习界广泛采用的 Python。其实 Lua 和Python 都属于比较容易入门的语言。但后者明显已经统治了机器学习领域，尤其在学界。而企业界的软件工程师最熟悉的是 Java，对 Lua 也比较陌生。这导致了 Torch 推广的困难。因此，虽然 Torch 功能强大，但并不是大众开发者的菜。

那么它强大在哪里？

首先，Torch 非常适用于卷积神经网络。它的开发者认为，Torch 的原生交互界面比其他框架用起来更自然、更得心应手。

因为这些强项，许多互联网巨头开发了定制版的 Torch，以助力他们的 AI 研究。这其中包括 Facebook、Twitter，和被谷歌招安前的 DeepMind。

与 Caffe 相比，在 Torch 里定义一个新层级比它要容易，因为你不需要写 C++ 代码。和 TensorFlow 和 Theano 比起来，Torch 的灵活度更高，因为它是命令式的；而前两者是陈述式的（declarative），你必须 declare 一个计算图。这使得在 Torch 上进行束搜索（beam search）这样的操作要比它们容易得多。

Torch 的热门应用：在增强学习领域，用卷积神经网络和代理处理图像问题。

兴趣主要在增强学习的开发者， Torch 是首选。

SciKit-learn 是老牌的开源 Python 算法框架，始于 2007 年的 Google Summer of Code 项目，最初由 David Cournapeau 开发。

它是一个简洁、高效的算法库，提供一系列的监督学习和无监督学习的算法，以用于数据挖掘和数据分析。SciKit-learn 几乎覆盖了机器学习的所有主流算法，这为其在 Python 开源世界中奠定了江湖地位。

它的算法库建立在 SciPy (Scientific Python) 之上——你必须先安装 SciPy 才能使用 SciKit-learn 。它的框架中一共包括了：

它命名的由来：SciPy 的扩展和模块在传统上被命名为 SciKits。而提供学习算法的模组就被命名为 scikit-learn。

它与 Python 世界另一大算法框架——TensorFlow 的主要区别是：TensorFlow 更底层。而 SciKit-learn 提供了执行机器学习算法的模块化方案，很多算法模型直接就能用。

提到出身学界的开源框架，就不得不提 MXNet。不过，因为亚马逊已将其作为御用平台，因而上期的盘点（谷歌、微软、OpenAI 等巨头的七大机器学习开源项目看这篇就够了）中已经对其作了介绍。有兴趣的读者请戳链接。

作者：两味真火

来源：51CTO

python机器学习数据建模与分析——数据预测与预测建模机器学习的预测建模在多个领域都具有重要的应用价值，包括个性化推荐、商品搜索、自动驾驶、人脸识别等。本篇文章将带领大家了解什么是预测建模
python机器学习——朴素贝叶斯算法笔记详细记录朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法。最为广泛的两种分类模型是决策树模型(Decision Tree Model)和朴素贝叶斯模型（Naive Bayesian Model，NBM）。和决策树模型相比，朴素贝叶斯分类器(Naive Bayes Classifier 或 NBC)发源于古典数学理论，有着坚实的数学基础，以及稳定的分类效率。同时，NBC模型所需估计的参数很少，对缺失数据不太敏感，算法也比较简单。
python机器学习课程——决策树全网最详解超详细笔记附代码决策树算法是一种逼近离散函数值的方法。它是一种典型的分类方法，首先对数据进行处理，利用归纳算法生成可读的规则和决策树，然后使用决策对新数据进行分析。本质上决策树是通过一系列规则对数据进行分类的过程。决策树方法最早产生于上世纪60年代，到70年代末。由J Ross Quinlan提出了ID3算法，此算法的目的在于减少树的深度。但是忽略了叶子数目的研究。C4.5算法在ID3算法的基础上进行了改进，对于预测变量的缺值处理、剪枝技术、派生规则等方面作了较大改进，既适合于分类问题，又适合于回归问题。决策树算法构造决策
python机器学习数据建模与分析——决策树详解及可视化案例你是否玩过二十个问题的游戏，游戏的规则很简单:参与游戏的一方在脑海里想某个事物，其他参与者向他提问题，只允许提20个问题，问题的答案也只能用对或错回答。问问题的人通过推断分解，逐步缩小待猜测事物的范围。决策树的工作原理与20个问题类似，用户输人一系列数据，然后给出游戏的答案。我们经常使用决策树处理分类问题,近来的调查表明决策树也是最经常使用的数据挖掘算法。它之所以如此流行，一个很重要的原因就是使用者基本上不用了解机器学习算法，也不用深究它是如何工作的。

猜你喜欢

已解决error：stray‘243‘in program异常的正确解决方法，亲测有效！！！
Nginx 一网打尽
Android之Volley使用
[OHIF-Viewers]医疗数字阅片-医学影像-cornerstone-core-Cornerstone.js-Cornerstone Examples-基石实例-下
【虹科】配备 LiDAR 的送货无人机——让物流变得绿色且具有成本效益
c++ dmp文件生成与分析
自学软件测试，现在年薪30w，我骄傲了吗？
Java的Hashset以及其底层的HashMap分析
树莓派玩耍笔记2 -- 我的板子是正品么？（解答一些小问题）
vue props的理解
在vue中_this和this的区别
php mysqli操作数据库
企业微信开发（2）——授权安装应用回调
分组背包
在TTF字体中提取想要的文字
python核心编程学习记录之映射和集合类型
NPM 使用介绍

相关主题

机器学习基础
机器学习和统计学习
[ML] 机器学习简介
机器学习 — 推荐系统
机器学习之KNN算法
机器学习之概率论

zl程序教程

当前栏目

盘点四大民间机器学习开源框架

相关文章