zl程序教程

您现在的位置是:首页 >  大数据

当前栏目

当CPU成为计算单元之一

计算CPU 成为 之一 单元
2023-09-11 14:22:36 时间

曾经在21世纪前期大放异彩的CPU多核并行解决方案在今天已经成了提升系统性能的瓶颈,新型智能卸载互连技术会是新的救星?

高性能计算发展至今 以CPU为核心的设计架构已成为瓶颈

过去15至20年,高性能计算的发展历经了一些重要的变革阶段。首先是从最初的SMP这样的小型机到集群系统的演变。2000年左右,计算机集群能够通过更多的通用服务器去扩展,满足性能的需求,而此时,集群式通讯像MPI这样的方式就起到了重要的连接作用。

第二个阶段是CPU由单核向多核的设计模式转变。大概在2008年到2010年,单核心CPU的主频已经上升到了一个瓶颈,而采用并行的多核心CPU,让处理器能够同时执行多个进程,有效的提升了系统性能。

但这种增加CPU核心数量的模式却同时增加了互联系统的负担,也让网络互连成为系统性能的瓶颈。但其实,与通信模式相比,互连延迟的改进所能带来的影响也是杯水车薪。目前,InfiniBand交换机的普遍延迟为90纳秒,InfiniBand适配器的延迟是100纳秒,而CPU处理的通信框架,比如MPI,它的延迟在几十微秒范围内(1微秒=1000纳秒)。这种不同数量级的通信延迟差距,让我们意识到,在互连系统延迟方面所做的工作已经价值不大。

面临并没有实际提升的单应用性能,多核模式也无法向上扩展,以CPU为核心的设计模式遭遇瓶颈。当前阶段,HPC市场正在历经新一轮的技术转型。

接下来 由多核转向协处理?

在当前数据爆炸的时代,数据处理也要求更快更实时,按照传统的方式,CPU需要等待数据传输,也就是数据传输和数据处理无法并行的“终极问题”,两年前,有人提出让数据更加靠近CPU,从而加快计算速度。然而这在当前大规模分布式数据存储的今天看来,仍然不可行。那么由此就产生了分散设计的概念,让网络成为协同处理单元,承担一部分计算任务,数据不需要移动到CPU才能计算,在移动到协处理器,分散的网络节点就能够执行计算。从简单的以CPU为核心的计算到CPU只作为计算单元之一,这种协同设计的思路的确让人重燃希望。但也存在一些质疑,网络节点作为协处理器,它能承载的计算负荷将实现何种比例的性能转化?而同时作为计算处理单元,势必会影响到网络节点本身的交换传输速率?软件的设计真的能够解决硬件无法突破的性能瓶颈吗?作为一种革新的设计理念,是否能够在当前的市场上获得认可并得以推广……

作为co-design的倡导者,Mellanox在最近发布的智能交换机Switch-IB 2当中展示了实践成果。除了具备最快的90ns的延迟和丰富交换机特性之外,Switch-IB 2智能交换机的意义还在于它将原来在高性能计算里用得最多的MPI的操作,由CPU转移到交换机来完成。Mellanox公司全球市场部副总裁Gilad Shainer表示:“这是在协同设计里面非常重要的一步,也是第一步,把集群的通讯移到交换机里去完成,通过这一步我们可以提高10倍的应用程序的性能。”据了解,这种智能卸载技术未来将扩展到更多的AI、DeepLearning场景,除了在高性能计算领域,在更多的这种密集传输的场景下,智能的连接解决方案将大有可为。
本文转自d1net(转载)


基因组大数据计算:CPU和GPU加速方案深度评测 Sentieon软件是通过改进算法模型实现性能加速(纯CPU环境,支持X86/ARM),不依赖于昂贵高功耗的专用硬件配置(GPU/FPGA),不依赖专有编程语言;同时Sentieon软件针对几乎所有的短读长和长读测序平台进行了优化,是FDA多次公开挑战赛的连续赢家。本次评测展现了Sentieon软件在Intel Xeon平台上的卓越性能,是基因组二级分析的最佳解决方案。
阿里云服务器通用型g6和计算型c6有什么区别?CPU内存比差异 阿里云服务器通用型g6和计算型c6有什么区别?一个是ECS通用型g6实例,一个是ECS计算型c6实例,CPU内存比不同,CPU均采用2.5 GHz主频的Intel Xeon Platinum 8269CY(Cascade Lake),睿频3.2 GHz
阿里云ARM服务器计算型c8y实例CPU倚天Yitian 710性能评测 阿里云服务器ECS计算型c8y实例,CPU采用2.75 GHz主频的倚天710处理器,c8y云服务器自研倚天710 ARM架构CPU,依托第四代神龙架构,提供稳定可预期的超高性能
阿里云ECS计算型c8y服务器CPU倚天710 ARM架构性能详解 阿里云服务器ECS计算型c8y倚天710 ARM架构CPU处理器性能详解,CPU处理器采用Yitian 710,ECS计算型c8y实例采用阿里云自研倚天710 ARM架构CPU,依托第四代神龙架构
阿里云8核16G服务器ecs.c6.2xlarge计算型c6处理器CPU性能评测 阿里云服务器ECS计算型c6实例ecs.c6.2xlarge为4核8G配置,CPU处理器采用Intel Xeon(Cascade Lake) Platinum 8269CY,2.5 GHz主频,睿频3.2 GHz
自研CPU实现大规模应用,新型计算体系正在到来 阿里巴巴宣布自研CPU倚天710已大规模应用,阿里云未来两年20%的新增算力将使用自研CPU。目前,倚天710已在阿里云数据中心大规模部署,并以云的形式服务阿里巴巴和多家互联网科技公司,算力性价比提升超30%,单位算力功耗降低60%,这是中国首个云上大规模应用的自研CPU。
阿里云服务器ECS计算型c6实例2核4G配置CPU处理器性能评测 阿里云服务器C6计算型2核4G配置ecs.c6.large性能评测,CPU采用Intel Xeon(Cascade Lake) Platinum 8269CY,2.5 GHz主频,睿频3.2 GHz