您现在的位置是：首页 > 其他

当前栏目

雅虎开源人工智能独门武器 CaffeOnSpark

服务器开源学习数据人工智能

2023-03-14 10:15:37 时间

又有一家科技巨头向全世界公开了他们的 know-how 人工智能。2月25日，Yahoo 发布了 CaffeOnSpark 人工智能的源代码，每个学术研究人员或是大公司都可以使用或是加以修改。

Yahoo 在科技方面的实力大概鲜有人知。事实上开源 Hadoop 就是 Yahoo 孵化的；Facebook、Twitter 以及其他不少公司都在用这个数据处理平台。因此在人工智能方面，Yahoo 公司有着独到的长处，因为在培训人工智能系统的时候，数据就和算法一样重要。而且 Yahoo 手握着全球最有趣***的资料库之一：相片社群网站 Flickr。

就如诸多新的开源人工智能项目一样，CafffeOnSpark 的根基是深度学习。深度学习是人工智能的一个分支，以其人类语音、照片和视频等的识别能力见长。Yahoo 就是用这项技术来识别照片中的不同内容，以此改良 Flickr 网站的搜索结果。与其他网站不同，Flickr 的图片搜索并不是靠图片描述或是用户输入的关键词。Yahoo 会教电脑如何识别照片的某种特征，例如特定的颜色，甚至是物体或动物。

在最近几个月里，Google 开放了深度学习网络 TensorFlow 的源代码，Microsoft 开放了类似的网络 CNTK，Facebook 分享了人工智能硬件设计，中国搜索引擎巨头百度也公开了深度学习训练软件。

这些开源技术项目都各自有所侧重，偏向不同。例如 Yahoo 的目的是要在现存的系统上运行深度学习，避免把数据从一个地方传输到另一个地方。Yahoo 的构架副总裁 Andy Fent 向我们解释，训练深度学习系统识别图片需要巨量的数据信息。你得往算法里放大量的例子，越多越好，比如如果是一只猫的话，系统要足够的图才会「学会」辨认猫之间的共同特征，分辨猫和其他动物。

Flickr 网站上有成千上万张图片，足够拿来训练人工智能了。但是开发团队不想把这些图片从 Flickr 服务器传送到另一层运行深度学习软件的服务器里。于是他们发明了在已有的构架上运行深度学习软件的方法。

从名字上看，CaffeOnSpark 结合了两种现有的科技：深度学习框架 Caffe 和大规模数据处理系统 Spark。Yahoo 所做的就是想办法在 Spark 层次上运行 Caffe。找到方法后，Caffe 不仅可以在 Spark 上运行，还可以两者一起在 Hadoop 上运行。Yahoo 的开发不仅会让人工智能开发者用更简单熟悉的工具、省去传送数据的麻烦过程，还能让深度学习更方便地同时处理数个服务器的内容。Feng 还特意告诉我们，这一点 Google 的 TensorFlow 目前还做不到，Yahoo 领先了一步。

Feng 说到，去年团队在博客上发表了有关 CaffeOnSpark 的帖子后，不少公司都希望 Yahoo 开放 CaffeOnSpark 的源代码。于是他们发现，不少公司其实服务器上都已经具备了不少信息，但是他们不想传送。

猜你喜欢

鲜为人知但很有用的 HTML 属性
在 Go 里用 CGO？这 7 个问题你要关注！
数据孤岛是业务效率的无声杀手
9款优秀的去中心化通讯软件 Matrix 的客户端
翻转再翻转！有意思的水平横向溢出滚动
发现 Linux SpaceFM 文件管理器的威力
图像处理工具Python扩展库，你了解吗？
求职数据分析，项目经验该怎么写
自定义计数器小技巧！CSS 实现长按点赞累加动画
在OKR中，我看到了数据驱动业务的未来
2023展望：新的一年将给大数据分析领域带来什么？
过五关！React高频面试题指南
阿里云ADB基于Hudi构建Lakehouse的实践
火山引擎云原生大数据在金融行业的实践
OpenHarmony富设备移植指南（二）—从postmarketOS获取移植资源
《数据成熟度指数》报告：64%的企业领袖认为大多数员工“不懂数据”
OpenHarmony 小型系统兼容性测试指南
肯睿中国（Cloudera）：2023年企业数字战略三大趋势预测
适用于 Linux 的十大命令行游戏
软件开发中的十个认知偏差

zl程序教程

当前栏目

雅虎开源人工智能独门武器 CaffeOnSpark

相关文章