内存究竟有多快？

现在的位置: 首页 > 综合 > 正文

内存究竟有多快？

2018年04月14日 ⁄ 综合 ⁄ 共 1393字 ⁄ 字号小中大 ⁄ 评论关闭

form: http://www.yankay.com/%E5%86%85%E5%AD%98%E7%A9%B6%E7%AB%9F%E6%9C%89%E5%A4%9A%E5%BF%AB%EF%BC%9F/

一般来说。CPU需要0个周期来访问其寄存器，1-30个周期来访问高速缓存，50-200个周期来访问主存。

对于Intel Core i7来说。这个值可以很具体。Intel Core i7的主频约在2-3GHz。可以计算出。

	L1—指令缓存	L1-数据缓存	L2-缓存	L3-缓存	内存
访问周期	4	4	11	30-40	50-200
缓存大小	32KB	32KB	256KB	8MB	若干GB
访问时间	2ns	2ns	5ns	14-18ns	24-93ns

也就是说，访问内存的时间是ns级别的。

再来看看磁盘。

磁盘的访问时间=寻道时间+旋转延迟+数据传输时间。对于普通的7200转STAT磁盘。这个值是:9ms+4ms+0.02ms=13.02ms。

也就是说，如果从磁盘随机访问一个字节，需要13.02ms，比从内存获取的时间24-93ns，至少要多14万倍。相差5个数据级，何其巨大的差距。

顺序读写磁盘会快一些。假设一个盘片有1000个扇区，每个扇区512字节，7200转。顺序读可以忽略掉寻道的时间。所以吞吐量是扇区数×扇区大小×转速=1000*512/(60/7200)=58MB/s。这个数据似乎不咋样。如果使用多盘系统。STAT II的接口，吞吐量可以达到300MB/s。追求极限性能可以mount裸盘直接操作多盘。

存储器山

《深入理解计算机系统》一书中提到了一个存储器山的概念。教授先生别出心裁的将存储器的吞吐量，画成了一座山。

存储器山的测试程序是这样的：

Kernel_loop(elems, stride):
for (i = 0; i < elems; i += stride)
    result = data[i];

X轴表示的是读取步长，Y轴是吞吐量，Z轴是数据总量的大小。

可以看出来步长越小，数据数据总量越小。性能越好。

很明显，山是不是平滑的，是成阶梯状。红色部分为L1缓存，绿色为L2缓存，浅蓝是L3缓存，深蓝是内存。我们可以得一些数据。

	L1-数据缓存	L2-缓存	L3-缓存	内存	磁盘	SSD
缓存大小	32KB	256KB	8MB	十几GB	几TB	几百GB
访问时间	2ns	5ns	14-18ns	24-93ns	13.0ms	30-300us
吞吐量	6500MB/s	3300MB/s	2200MB/s	800MB/s	60MB/s	250MB/s

也就是说，去除高速缓存的内存，吞吐量性能只有800MB/s而已。比起磁盘的300MB/s,网络的100MB/s。也只是快了几倍。平时说内存比磁盘快许多，其实没有那么多，如果不好好操作内存，内存的频繁读写，也可以成为系统瓶颈。

总结

现在处理器的主频已经停止了增长。但是高速缓存仍然以摩尔定律的速度增长的。长久的看，高速缓存频率逐渐会追上处理器的性能，容量也会越来越大。但是内存则不容乐观，虽然容量增加了许多，但是性能确没有大的提升,磁盘的状况也是类似;SSD刚刚开始普及,趋势不明显。

但可以看到，SSD的吞吐量和内存的吞吐量相去并不大。也就是说在未来，当SSD完全替代了磁盘。我们要像现在操作磁盘一样小心翼翼地操作内存，才有可能写出符合那个时代计算机性能的程序。相比之下，SSD的使用比磁盘要轻松一些，毕竟随机读写的速度在一两个数量级上。

【上篇】牛逼的面试题
【下篇】技术方案评审

作者: semifinal

该日志由 semifinal 于6年前发表在综合分类下，最后更新于 2018年04月14日.
转载请注明: 内存究竟有多快？ | 学步园 +复制链接

抱歉!评论已关闭.

学步园

内存究竟有多快？

作者: semifinal

书签

最新文章New

本站推荐

返回首页