您现在的位置是：首页 > IT要闻

当前栏目

Spark将机器学习与GPU加速机制纳入自身

学习 Spark

2023-03-14 10:16:26 时间

【51CTO.com快译】

Databricks公司通过简化对GPU加速型机器学习方案的访问支持自家云Spark服务。

作为Apache Spark内存内大数据项目的支持与开发合作厂商，Databricks公司已经对其自家Apache Spark云实现方案进行两轮支持升级，旨在让更多IT用户享受其便利。

此次推出的新功能——即GPU加速与多套深度学习库集成——在理论上能够实现Apache Spark在任意位置的安装工作。不过Databricks方面表示，其版本目前仍处于调整阶段，这是为了避免资源争用情况给功能的实际使用带来复杂性影响。

Apache Spark本身并不具备开箱即用的GPU加速功能，且需要设置一套系统对此加以支持，这意味着用户需要面对多种复杂组件。有鉴于此，Databrick公司决定承担起相关难题。

Databricks方面还宣称，其将降低节点间的资源争用数量，从而***程度保证Spark的运作能够充分发挥GPU集群的性能优势。这一思路与麻省理工学院的Milk库看起来非常类似，后者同样利用加速机制并发处理应用，旨在确保与内存相关的操作以批量方式进行，最终实现对系统缓存资源的***化利用。Databricks公司的设置能够保证各项GPU操作之间不会相互导致冲突乃至中断。

另一项能够显著节约时间的举措在于直接访问多种主流机器学习库，这意味着Spark将可作为数据源起效。其中包括Databricks自家的TensorFrames库，其允许将TensorFlow库与Spark相配合，同时实现GPU加速能力。

Databricks 公司已经在推文中表示，其基础设施能够充分利用Spark的自身优势。其建立起免费级服务，用以吸引那些仍对深度使用Spark抱有警惕心理的客户，包括为其提供完整产品中的部分功能。根据InfoWorld网站此前发布的评测报告，Databricks的免费产品确实相当出色且易于上手。

不过市场竞争仍然相当激烈，特别是考虑到Databricks需要面对像微软(拥有Azure机器学习方案)、IBM以及Amazon这样的巨头级对手。因此，其必须找到保持并扩大服务受众规模的可行途径，并专注于打造自身独特的服务产品。除了添加机器学习与GPU加速等功能之外，Databricks还需要在发展计划中确保新特性能够切实带来便利——而非提升复杂程度。

原文标题：Spark picks up machine learning, GPU acceleration，原文作者：Serdar Yegulalp

【51CTO译稿，合作站点转载请注明原文译者和出处为51CTO.com】

猜你喜欢

如何在编程生涯中有一个好的开端
程序员要有持续产出
程序员如何更快的适应新工作
程序员必读：一个码农在硅谷的悲惨故事
Java查询大文本文件的处理方法
优秀程序员眼中的整洁代码
Oracle提议将G1作为Java 9的默认垃圾收集器
全球最受欢迎的计算机编程语言
各种 Java 的序列化库的性能比较测试结果
C#中一道关于多线程的基础练习题——模拟仓库存销过程
企业级Java应用最重要的4个性能指标
程序员学习编程需要攻克的8个障碍
一套跨平台五子棋网游的开发经历
那些令人喷饭的代码注释：仅以此代码献给..
聊一下C#开发者如何过渡到JAVA 开发者
让程序员跳槽的非钱原因
Java中使用CompletableFuture处理异步超时
用医生的思考方式调试你的代码
关于 Java 对象序列化您不知道的 5 件事
.NET平台下的微信SDK（Rabbit.WeiXin）开源发布

zl程序教程

当前栏目

Spark将机器学习与GPU加速机制纳入自身

相关文章