迅维网

内存性能指什么,正确解读看这

zxbai 2018-12-25 13:41


  一台服务器,不管是物理机还是虚拟机,必不可少的就是内存,内存性能指什么?又是如何来衡量呢。

  1. 内存与缓存


  现在比较新的处理器一般都有三级缓存,L1 Cache(32KB-256KB),L2 Cache(128KB-2MB),L3 Cache(1M-32M)。缓存慢慢变大,处理器在取数据的时候,优先从缓存去取数据,取不到才去内存取数据。

内存性能的正确解读

内存性能指什么 图1


  2. 内存与时延


  显然,越靠近处理器,取数据的速度越块,通过LMBench进行了读数延迟的测验。

内存性能的正确解读

内存性能指什么 图2


  从上图可以看出:
  1. Intel(R) Xeon(R) Platinum 8163 处理器 @ 2.50GHz 这款处理器的L1D Cache,L1I Cache为32KB,而L2 Cache为1M,L3为32M;
  2. 在对应的Cache中,时延是稳定的;
  3. 不一样缓存的时延呈现指数级增长;

  所以我们在写业务代码的时候,如果想要更快地提升效率,那么使得计算更加贴近处理器则可以获得更好的性能。但是从上图也可以看出,内存的时延都是纳秒为单位,而实际业务中都是毫秒为单位,优化的重点应该是那些以毫秒为单位的运算,而内存时延优化这块则是长尾部分。

  3. 内存带宽


  内存时延与缓存其实可谓是紧密相关,不理解透彻了,则可能测的是缓存时延。同样测验内存带宽,如果不是正确的测验,则测的是缓存带宽了。

  为了了解内存带宽,有必要去了解下内存与处理器的架构,早期的处理器与内存的架构还需要经过北桥总线,现在处理器与内存直接已经不需要北桥,直接通过处理器的内存控制器(IMC)进行内存读取操作:

内存性能的正确解读


  那对应的内存带宽是怎样的呢?测验内存带宽有很多很多工具,linux下一般通过stream进行测验。简单介绍下stream的算法:

内存性能的正确解读

内存性能指什么 图3


  stream算法的原理从上图可以看出非常简单:某个内存块之间的数据读取出来,经过简单的运算放入另一个内存块。那所谓的内存带宽:内存带宽=搬运的内存大小/耗时。通过整机合理的测验,可以测出来内存控制器的带宽。下图是某云产品的内存带宽数据:
-------------------------------------------------------------Function Best Rate MB/s Avg time Min time Max timeCopy: 128728.5 0.134157 0.133458 0.136076Scale: 128656.4 0.134349 0.133533 0.137638Add: 144763.0 0.178851 0.178014 0.181158Triad: 144779.8 0.178717 0.177993 0.180214-------------------------------------------------------------

  内存带宽的重要性自然不言而喻,这意味着操作内存的最大数据吞吐量。但是正确合理的测验非常重要,有几个注意事项需要关心:
  1. 内存数组大小的设置,必须要远大于L3 Cache的大小,否则就是测验缓存的吞吐性能;
  2. 处理器数目很有关系,一般来说,一两个核的计算能力,是远远到不了内存带宽的,整机的处理器所有运行起来,才可以有效地测验内存带宽。当然跑单核的stream测验也有意义,可以测验内存的延时。

  4. 其他

  1. 内存与NUMA的关系:开启NUMA,可以有效地提供内存的吞吐性能,降低内存时延。
  2. stream算法的编译方式选择:通过icc编译,可以有效地提供内存带宽性能分。原因是Intel优化了处理器的指令,通过指令向量化和指令Prefetch操作,加速了数据的读写操作以及指令操作。当然其他C代码都可以通过icc编译的方式,提供指令的效率。
  以上就是关于内存性能指什么问题的解答。


雷人

握手
1

鲜花

鸡蛋
1

路过

刚表态过的朋友 (2 人)

收藏
来自: 今日头条
关闭

站长提醒 上一条 /1 下一条

返回顶部
附近
店铺
微信扫码查看附近店铺
维修
报价
扫码查看手机版报价
信号元
件查询
点位图


芯片搜索