问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

普通计算机和大型服务器的GPU温度测量原理(硬件)?

发布网友 发布时间:2022-04-22 03:11

我来回答

1个回答

热心网友 时间:2023-05-24 12:25

深度学习GPU工作站/服务器硬件配置方案

I
市场上用于深度学习训练计算机大致情况如下:

(1)服务器/工作站(支持2、4、8块GPU架构):普遍存在噪音大,无法放置于办公环境,必须放到专门的机房,维护成本高,另外数据存储带宽、延迟、容量也不尽如意。

(2)分布式集群架构:性能强大,但是开发成本太高(太贵),是大多数科研单位及个人无法承受。

(3)组装电脑:这类特点是价格便宜,但是在散热和功率方面依然是普通家用/游戏电脑标准,稳定性巨差。

(4)大部分GPU计算机(服务器/工作站):重点都放在GPU卡数量上,似乎只要配上足够GPU卡,就可以了。

然而,机器硬件配置还需要整体均衡,不同的学习框架更需要不同GPU卡去适配。

主流学习框架

主流框架加速效能

上图是不同的DL框架加速效能(NVIDIA GP100为例),不同的框架并不是GPU越多效能就越高。

深度学习计算密集,所以需要一个快速多核CPU,对吧?!

听说深度学习有很多显卡就可以了,一个高速CPU可能是种浪费?!

搭建一个深度学习系统时,最糟糕的事情之一就是把钱浪费在并非必需的硬件上。

一个高性能且经济的深度学习系统所需的硬件到底要如何配置?!

一. 深度学习计算特点与硬件配置分析:

深度学习计算特点

1.数据存储要求

在一些深度学习案例中,数据存储会成为明显的瓶颈。做深度学习首先需要一个好的存储系统,将历史资料保存起来。

主要任务:历史数据存储,如:文字、图像、声音、视频、数据库等。

数据容量:提供足够高的存储能力。

读写带宽:多硬盘并行读写架构提高数据读写带宽。

接口:高带宽,同时延迟低。

传统解决方式:专门的存储服务器,借助万兆端口访问。

缺点:带宽不高,对深度学习的数据读取过程时间长(延迟大,两台机器之间数据交换),成本还巨高。

UltraLA解决方案:

将并行存储直接通过PCIe接口,提供最大16个硬盘的并行读取,数据量大并行读取要求高,无论是总线还是硬盘并行带宽,都得到加大提升,满足海量数据密集I/O请求和计算需要。

2. CPU要求

如今深度学习CPU似乎不那么重要了,因为我们都在用GPU,为了能够明智地选择CPU我们首先需要理解CPU,以及它是如何与深度学习相关联的,CPU能为深度学习做什么呢?当你在GPU上跑深度网络时,CPU进行的计算很少,但是CPU仍然需要处理以下事情:

(1)数据从存储系统调入到内存的解压计算。

(2)GPU计算前的数据预处理。

(3)在代码中写入并读取变量,执行指令如函数调用,创建小批量数据,启动到GPU的数据传输。

(4)GPU多卡并行计算前,每个核负责一块卡的所需要的数据并行切分处理和控制。

(5)增值几个变量、评估几个布尔表达式、在GPU或在编程里面调用几个函数——所有这些会取决于CPU核的频率,此时唯有提升CPU频率。

传统解决方式:CPU规格很随意,核数和频率没有任何要求。

UltraLA解决方案:

CPU频率尽量高

CPU*缓存尽量大(有必要科普一下CPU缓存)

“这是个经常被忽视的问题,但是通常来说,它在整个性能问题中是非常重要的一部分。CPU缓存是容量非常小的直接位于CPU芯片上的存储,物理位置非常接近CPU,能够用来进行高速计算和操作。CPU通常有缓存分级,从小型高速缓存(L1,L2)到低速大型缓存(L3,L4)。作为一个程序员,你可以将它想成一个哈希表,每条数据都是一个键值对(key-value-pair),可以高速的基于特定键进行查找:如果找到,就可以在缓存得值中进行快速读取和写入操作;如果没有找到(被称为缓存未命中),CPU需要等待RAM赶上,之后再从内存进行读值——一个非常缓慢的过程。重复的缓存未命中会导致性能的大幅下降。有效的CPU缓存方案与架构对于CPU性能来说非常关键。深度学习代码部分——如变量与函数调用会从缓存中直接受益。”

CPU核数:比GPU卡数量大(原则:1核对应1卡,核数要有至少2个冗余)。

3. GPU要求

如果你正在构建或升级你的深度学习系统,你最关心的应该也是GPU。GPU正是深度学习应用的核心要素——计算性能提升上,收获巨大。

主要任务:承担深度学习的数据建模计算、运行复杂算法。

传统架构:提供1~8块GPU。

UltraLA解决方案:

数据带宽:PCIe8x 3.0以上。

数据容量:显存大小很关键。

深度学习框架匹配:CPU核-GPU卡 1对1。

GPU卡加速:多卡提升并行处理效率。

4.内存要求

至少要和你的GPU显存存大小相同的内存。当然你也能用更小的内存工作,但是,你或许需要一步步转移数据。总而言之,如果钱够,而且需要做很多预处理,就不必在内存瓶颈上兜转,浪费时间。

主要任务:存放预处理的数据,待GPU读取处理,中间结果存放。

UltraLA解决方案:

数据带宽最大化:单Xeon E5v4 4通道内存,双XeonE5v4 8通道内存,内存带宽最大化。

内存容量合理化:大于GPU总显存。

说了那么多,到底该如何配置深度学习工作站,下面是干货来袭~

二. 深度学习工作站介绍与配置推荐

1. UltraLABGX370i-科研型

UltraLAB GX370i-科研型

硬件架构:4核4.7GHz~5.0GHz+4块GPU+64GB内存+4块硬盘(最大)

机器特点:高性价比,最快预处理和GPU超算架构

数据规模:小规模

2. UltraLABGX490i-高效型

硬件架构:配置10核4.5GHz+4块GPU+128GB+4块硬盘(最大)

机器特点:较GX360i,CPU核数和内存容量提升

数据规模:中小规模

UltraLAB GX490i基准配置

3. UltraLABGX490M-高性能型

硬件架构:配置6核4.5GHz/8核4.3GHz/10核4.3GHz+最大7块GPU+256GB+20盘位并行存储

机器特点:GPU数量支持到7块,支持海量数据并行存储

数据规模:中大规模

4. UltraLABGX620M-超级型

UltraLAB GX620M

硬件架构:双Xeon可扩展处理器(最大56核,最高3.8GHz)+最大9块GPU+20盘位并行存

机器特点:目前最强大的CPU+GPU异构计算

数据规模:建模与仿真计算、高性能科学计算、机器/深度学习

UltraLAB GX620M基准配置

UltraLAB深度学习工作站特点:

(1)种类丰富: GX370i(1C4G), GX490i(1C4G) --科研型,GX490M(1C7G)、GX620M(2C9G)--超级型。

(2)性能特点:超高频+多GPU+海量高速存储+静音级=最完美强大DL硬件平台。

(3)应用平台:完美支持TensorFlow,Caffe,Torch,DIGITS,
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
erp可以看评论地址吗 淘宝评论url是什么意思? 揭秘:码牌支付风控升级,背后真相揭秘 电脑电视直播软件哪个好用什么软件好电脑看电视直播 潼南子同街学区是哪些 三极管BU406价格和参数? 火锅料放在冰柜忘了插电一个星期给会坏了吗 火锅的设备有哪些 火锅餐厅厨房有哪些 小火锅厨房设备有哪些 GPU与CPU之间的关系 超算核时是什么意思? amd firepro s10000 6g 双gpu超算显卡能挖矿吗 电脑使用CPU挖矿好还是用GPU来挖比较好? 超算中心淘汰的那些芯片去哪了? GPU加速这东西真的有用吗 为什么要用GPU来训练神经网络而不是CPU GPU主要是处理图形的,CPU主要是进行数据运算的,... 世界上真的有干将莫邪剑吗 GPU和CPU到底谁运算能力强 历史上高渐离会用剑么 英伟达的 Tesla GPU 性能有多强劲,跟普通 GPU 的... 现实中真的是剑克斧,斧克枪,枪克剑吗? 中国古代里真的有天子剑吗? 请教高手,用GPU超算集群服务器玩游戏怎么样 梧桐树可以做宝剑嘛? 超级计算机如果图形显卡和GPU运算卡都没有的话,能... “中国宝剑之乡”与“中国冶铁铸剑之乡”有何区别? 超级计算机用什么GPU 英特尔NV还是AMD 神话中最厉害的剑? 2018年考基金从业资格证需要看什么书 2017年基金从业资格考试需要买什么教材?万分感谢 基金从业官方教材和天一教材的区别 基金从业资格考试是否需要看教材 买书指南:考基金从业资格买什么教材好 基金从业的考试科目及参考书 基金从业资格考试需要看什么书籍 手机投屏找不到小度添添 手机也么才能投屏小度? 男生穿丝袜怎麽搭配好看? 请教男生穿丝袜如何搭配服装和鞋子 男生穿黑色的丝袜应该怎么搭配? 男生穿什么丝袜,怎么搭配? 男穿丝袜配什么颜色鞋好 男士丝巾的围法,男士丝巾怎么搭配好看 黑丝绸怎么搭配男? 男生可以穿短丝袜吗,如果可以的话,什么颜色适合... 男人穿连裤袜上街打配短裙还是短裤好? 男生穿连裤袜搭配什么比较好? 男枪和金克丝什么关系