您现在的位置是：首页 > 大数据

当前栏目

浪潮发布GPU 深度学习一体机，大幅提升性能及生产力

性能学习发布提升深度 GPU 浪潮大幅

2023-09-27 14:23:37 时间

美国当地时间11月16日，在盐湖城举行的全球超算大会SC16上，浪潮发布了深度学习一体机D1000，该产品部署了采用NVIDIA® Tesla™ GPU技术的浪潮高性能计算集群，运行多节点并行深度学习框架Caffe-MPI，可大幅提升在人脸识别、图片分类、物体识别等应用场景的深度学习计算性能，并有效提高用户在实际业务使用深度学习的生产力。

强强联手产硕果

D1000产品整合了浪潮深度学习领域的最新技术成果，包括浪潮推动开发的并行版开源深度学习框架Caffe-MPI，英伟达专为深度学习定制的Tesla GPU及CuDNN库。浪潮展示了6节点的D1000产品方案，该方案的节点是浪潮专为深度学习开发的专用GPU服务器，每个节点配置2颗处理器及4块NVIDIA® Tesla™ M40 GPU。

浪潮发布GPU 深度学习一体机，大幅提升性能及生产力

浪潮集团海外总部副总经理Jay Zhang现场讲解

浪潮集团海外总部副总经理Jay Zhang表示，D1000在性能、扩展性等方面都大幅领先于以往的深度学习方案，可以满足大部分客户的应用需求。浪潮一直在加强深度学习前沿技术开发并致力于构建良好的生态系统，并联合NVIDIA等业界领先技术伙伴，将最新的技术整合为产品方案，转化为用户的实际应用价值。

浪潮发布GPU 深度学习一体机，大幅提升性能及生产力

Nvidia解决方案和工程架构副总裁 Marc Hamilton演讲

高性能深度学习框架Caffe-MPI

Caffe-MPI是浪潮团队推动开发并开源发布的集群版Caffe，这使得Caffe这一业界最重要的深度学习框架实现了高效多节点并行。Caffe-MPI不仅在单机多GPU方案中表现出高效的训练性能，而且支持分布式集群扩展。浪潮展示了6节点D1000产品方案在配置24块Tesla M40 GPU，并部署Caffe-MPI，训练GoogLeNet（Inception V1)网络，每秒可以处理2000张图片，在短短18小时内将GoogLeNet网络的精确度提高至78%。随着训练时间的增加，Caffe-MPI的正确率将进一步提升。此外，Caffe-MPI具有较高的可扩展性，其节点的扩展效率达到72%，并且Caffe-MPI完全保留了原始Caffe架构的特性，纯粹的C++/CUDA架构，支持命令行、Python和MATLAB接口等多种编程方式，上手快，十分易用。

浪潮发布GPU 深度学习一体机，大幅提升性能及生产力

D1000发布现场

让用户专注于业务应用

深度学习正在重新定义什么叫可能性，从初创时期的公司到大型互联网运营商，都在努力把深度学习融入实际业务中来拓展商业边界。Jay Zhang表示，浪潮为客户提供的是开箱即用的深度学习解决方案以及全程贴心服务，把用户从平台部署配置优化等繁琐工作中解放出来。

浪潮发布GPU 深度学习一体机，大幅提升性能及生产力

SC16现场吸睛的浪潮产品与方案

据了解，D1000统一整合了经过优化设计的浪潮高性能计算集群硬件、Caffe-MPI并行计算框架和依赖库、经过充分测试验证的OS和CUDA环境及集群管理调度平台 ClusterEngine，产品实现在产线进行软硬件一体化安装、配置，用户打开D1000即可使用Caffe-MPI进行深度学习业务应用。

原文发布时间为：2016年11月17日

本文来自云栖社区合作伙伴至顶网，了解相关信息可以关注至顶网。

4大技术亮点支撑应用优势全新一代旗舰型行业无人机千巡翼X4发布随着无人机与数字成像技术的发展，无人机航测成为了重要的地理信息采集手段，也越来越受重视。据相关研报数据统计，预计2025年我国实景三维在自然资源领域的，以数据采集、处理为主的直接市场规模预计将达40亿元，推测2025年关联市场规模将达400亿元左右。在这样的产业趋势之下，无人机航测平台也在不断发展，2023年2月28日，千寻位置发布了全新一代旗舰型行业无人机平台——千巡翼X4。通过对前沿技术的深度融合，千巡翼X4具备强大的功能，并在体现出更多的应用优势。
GPU 「抗压」不行还费电，FPGA将成深度学习「新基建」！ 1.GPU 矩阵运算很强，但「抗压」不行还费电 2.FPGA加持的深度学习，推理速度和吞吐量远超GPU 3.ASIC不够灵活，FPGA 更有可能成为深度学习的「底层建筑」
业界最高密度阿里云发布新一代浸没式液冷GPU服务器集群解决方案 10月20日，2021杭州云栖大会，阿里云携手英伟达，宣布将为客户提供搭载英伟达A100 GPU的新一代浸没式液冷服务器集群解决方案。作为全球领先的云服务提供商和数字经济的新基础设施，阿里云为英伟达异构算力服务领域丰富了新的解决方案，将为不同需求用户提供更丰富、更具性价比的GPU服务器集群解决方案。
阿里云潘岳：异构计算四年算力提升100倍，云上AI推理占比超50% 潘岳介绍，阿里云提供了超大规模的云上异构计算集群，每秒可支撑100亿亿次的异构运算，能够在1秒内看懂超过5.3亿张图片；识别3.3亿秒/9.2万小时长的语音，相当于听写了1723本《红楼梦》长篇小说或者26万篇短篇小说；1秒内可以翻译4千万句话，相当于翻译了42本《哈姆雷特》。
IBM 取得内存计算新突破，AI 训练能耗降低 80 倍 IBM Research 称，已经开发出了一种内存计算新方法，可以为微软和谷歌寻求的高性能和机器学习应用的硬件加速器提供答案。该方法被称为“混合精度内存计算”，论文发表在 Nature Electronics 期刊。
阿里达摩院布局“中国芯”，自研AI芯片性价比超同类40倍 4月19日，澎湃新闻（www.thepaper.cn）记者从阿里巴巴达摩院获悉，盖机构正研发一款神经网络芯片——Ali-NPU，运用于图像视频分析、机器学习等AI推理计算。按照设计，这款芯片性能将是目前市面上主流CPU、GPU架构AI芯片的10倍，而制造成本和功耗仅为一半，性价比超过40倍。

猜你喜欢

九、OpenGL 基础变化与矩阵堆栈
2.线性表
【Rust】格式化输出-List
【毕业设计】基于Springboot的BUG管理平台
boost program_options
node按顺序执行shell命令
利用okhttp框架实现包含验证码的用户登录，保持session操作（上）
【云计算】docker前世今生
如何优雅的选择字体(font-family)
两种方法删除ArrayList里反复元素
string.find()与string::npos
【Linux开发】如何更改linux文件的拥有者及用户组(chown和chgrp)
渗透测试信息收集—waf识别
【甄选靶场】Vulnhub百个项目渗透——项目二十五：temple-of-DOOM-v1（node.js反序列化，二进制文件提权）
Mybatis系列(四)：Mybatis缓存
Spring Boot 静态资源映射与上传文件路由配置
JavaScript 常用pc实例收集整理
Nginx的Keepalive的简单学习

相关主题

JVM 性能调优
oracle性能优化
机器学习和统计学习

zl程序教程

当前栏目

浪潮发布GPU 深度学习一体机，大幅提升性能及生产力

相关文章