计算机各系统组件的吞吐量和延迟 看图不说话
原创文章,转载请注明: 转载自系统技术非业余研究
本文链接地址: 计算机各系统组件的吞吐量和延迟 看图不说话
看图不说话
参考: 图片来源
Post Footer automatically generated by wp-posturl plugin for wordpress.
原创文章,转载请注明: 转载自系统技术非业余研究
本文链接地址: 计算机各系统组件的吞吐量和延迟 看图不说话
看图不说话
参考: 图片来源
Post Footer automatically generated by wp-posturl plugin for wordpress.
原创文章,转载请注明: 转载自系统技术非业余研究
本文链接地址: Linux下谁在切换我们的进程
我们在做Linux服务器的时候经常会需要知道谁在做进程切换,什么原因需要做进程切换。 因为进程切换的代价很高,我给出一个LMbench测试出来的数字:
Context switching – times in microseconds – smaller is better
————————————————————————-
Host OS 2p/0K 2p/16K 2p/64K 8p/16K 8p/64K 16p/16K 16p/64K
ctxsw ctxsw ctxsw ctxsw ctxsw ctxsw ctxsw
——— ————- —— —— —— —— —— ——- ——-
my174.cm4 Linux 2.6.18- 6.1100 7.0200 6.1100 8.7400 7.7200 8.96000 9.62000
在我的很高端的服务器上,进程切换的开销在8us左右, 这个相对于高性能的服务器是不可接受的, 所以我们要在一个时间片内尽可能的多做事情,而不是把时间浪费在无谓的切换上。
好奇害死猫,我们来调查下谁在切换我们的进程:
[root@my174 admin]# dstat 1 ----total-cpu-usage---- -dsk/total- -net/total- ---paging-- ---system-- usr sys idl wai hiq siq| read writ| recv send| in out | int csw 0 0 100 0 0 0| 0 0 | 796B 1488B| 0 0 |1004 128 0 0 100 0 0 0| 0 0 | 280B 728B| 0 0 |1005 114 0 0 100 0 0 0| 0 0 | 280B 728B| 0 0 |1005 128 0 0 100 0 0 0| 0 0 | 280B 728B| 0 0 |1005 114 0 0 100 0 0 0| 0 320k| 280B 728B| 0 0 |1008 143 ...
我们可以看到 csw的数目是 120/S, 但是dstat或者vmstat类似的工具并没有告诉我们谁在干坏事。好吧!我们自己动手行吧。
祭出我们可爱的systemtap!
[root@my174 admin]# cat >cswmon.stp #! /usr/bin/env stap # # global csw_count global idle_count probe scheduler.cpu_off { csw_count[task_prev, task_next]++ idle_count+=idle } function fmt_task(task_prev, task_next) { return sprintf("%s(%d)->%s(%d)", task_execname(task_prev), task_pid(task_prev), task_execname(task_next), task_pid(task_next)) } function print_cswtop () { printf ("%45s %10s\n", "Context switch", "COUNT") foreach ([task_prev, task_next] in csw_count- limit 20) { printf("%45s %10d\n", fmt_task(task_prev, task_next), csw_count[task_prev, task_next]) } printf("%45s %10d\n", "idle", idle_count) delete csw_count delete idle_count } probe timer.s($1) { print_cswtop () printf("--------------------------------------------------------------\n") } CTRL+D
这个脚本会每隔设定的时间打印出TOP 20切换最多的进程和他的pid, 我们来看下结果把:
[root@my174 admin]# stap cswmon.stp 5 Context switch COUNT swapper(0)->systemtap/11(908) 500 systemtap/11(908)->swapper(0) 498 swapper(0)->fct1-worker(2492) 50 fct1-worker(2492)->swapper(0) 50 swapper(0)->fct0-worker(2191) 50 fct0-worker(2191)->swapper(0) 50 swapper(0)->bond0(3432) 50 bond0(3432)->swapper(0) 50 stapio(879)->swapper(0) 26 swapper(0)->stapio(879) 25 stapio(879)->swapper(0) 19 swapper(0)->stapio(879) 17 swapper(0)->watchdog/9(31) 5 watchdog/9(31)->swapper(0) 5 swapper(0)->mysqld(18346) 5 mysqld(18346)->swapper(0) 5 swapper(0)->watchdog/13(43) 5 watchdog/13(43)->swapper(0) 5 swapper(0)->watchdog/14(46) 5 watchdog/14(46)->swapper(0) 5 idle 859 -------------------------------------------------------------- ...
我们可以看到进程从哪里切换到哪里,并且发生了多少次, 最后一行,我打印出来idle的次数,也就是说这时候系统没啥事情做,就切换到idle(0)这个进程去休息去了。
通过上面的调查,我们会很清楚的了解到我们系统的开销发生在那里,方便我们定位问题。
玩的开心!
Post Footer automatically generated by wp-posturl plugin for wordpress.
原创文章,转载请注明: 转载自系统技术非业余研究
本文链接地址: 用systemtap来修改下linux内核变量的值
我们在探索linux内核的时候,经常需要调整下变量的值,看它对系统的影响。如果这个值没有透过/proc来修改的话,那只能编译内核。这个步骤是非常繁琐的。现在我们有systemtap这个利器来帮忙了。
演示如下:
我们通过修改过
extern int sysctl_tcp_fin_timeout;的值来达到目的。是因为这个值是proc导出的 我们好验证是否成功。
root@localhost ~]# cat /proc/sys/net/ipv4/tcp_fin_timeout 15000 [root@localhost ~]# cat test.stp probe begin { printf("ready go\n"); } probe kernel.function("do_tcp_setsockopt") { $sysctl_tcp_fin_timeout = $1 printf("sysctl_tcp_fin_timeout = %d\n", $sysctl_tcp_fin_timeout); exit() } [root@localhost ~]# stap -g test.stp 18000 ready go
这个时候 stap在运行, 只是还没有触发do_tcp_setsockopt.
现在我们来触发
[root@localhost ~]# erl Erlang R13B02 (erts-5.7.3) [source] [64-bit] [smp:2:2] [rq:2] [async-threads:0] [hipe] [kernel-poll:false] Eshell V5.7.3 (abort with ^G) 1> {ok, LSock} = gen_tcp:listen(0, []). {ok,#Port<0.437>} 2> 2> inet:setopts(LSock, [{nodelay,true}]). ok 3>
Ok,这时候回头可以看到stap打出来以下:
sysctl_tcp_fin_timeout = 18000
我们来验证下:
root@localhost ~]# cat /proc/sys/net/ipv4/tcp_fin_timeout 18000
OK,成功。
Tips:
1. stap对全局变量的写需要-g guru模式。
2. 全局变量必须在一个单元内的函数里面才可以修改, 而且必须是在内核上下文。
PS. 这样写的话会更好,因为这个变量是单元可见的,这个模块里面的任何函数被触发都可以看到这个变量. 因为这是tcp的核心模块随时都会被出发的,免除了以上的麻烦!
$ cat test.stp probe begin { printf("ready go\n"); } probe kernel.function("*@net/ipv4/tcp.c") //probe kernel.function("do_tcp_setsockopt") { $sysctl_tcp_fin_timeout = $1 printf("sysctl_tcp_fin_timeout = %d\n", $sysctl_tcp_fin_timeout); exit() }
Post Footer automatically generated by wp-posturl plugin for wordpress.
Recent Comments