blocking technique介绍
September 7th, 2010
2 comments
原创文章,转载请注明: 转载自系统技术非业余研究
本文链接地址: blocking technique介绍
随着硬件技术的发展, CPU也越来越强大的。普通的服务器装配的Intel(R) Xeon(R) CPU E5520有4个core,每个core有32KL1D, 32KL1I, 256KL2,这些core还共享8M的L3。这些cache对提高系统的性能非常帮助, 因为L1的性能比主村高2个数量级。但是我们也看到L1 cache太小了,而且对程序员来讲是透明的,我们不知道它的存在。
那么我们的程序如何利用这些硬件设施呢。 设想下,如果你的4个core能同时工作,每个core又在充分利用自己的L1,L2, 同时L3还充满备用数据,那么这个提速是可以想象的到的。
这时候我们需要blocking technique技术:
看图不说话
这个技术的核心就是把数据集控制在L1的范围内,并发的多核计算!
有兴趣的同学可以进一步:
下载更详细的CISE-12-2-ScientificPro
玩的开心!
Post Footer automatically generated by wp-posturl plugin for wordpress.
Recent Comments