您现在的位置是：首页 > 系统

当前栏目

linux 系统性能指标详解程序员

Linux 系统程序员详解性能指标

2023-06-13 09:19:57 时间

一、查看CPU使用情况

cpu使用率反映的是当前cpu的繁忙程度，忽高忽低的原因在于占用cpu处理时间的进程可能处于io等待状态但却还未释放进入wait。

平均负载（loadaverage）是指某段时间内占用cpu时间的进程和等待cpu时间的进程数，这里等待cpu时间的进程是指等待被唤醒的进程，不包括处于wait状态进程。

1、良好状态指标

CPU利用率：

User Time =70%，System Time = 35%，User Time + System Time = 70%。

上下文切换：与CPU利用率相关联，如果CPU利用率状态良好，大量的上下文切换也是可以接受的。

可运行队列：每个处理器的可运行队列 =3个线程。

2、工具

（1）vmstat

字段说明：

[[email protected] ~]#uptime 

00:44:22 up 1:17,3 users, load average: 8.13, 5.90, 4,94 

显示的是过去的1,5,15分钟内进程队列中的平均进程数量

如何衡量当前系统是否负载过高?

如果每个cpu(可以按CPU核心的数量计算)上当前活动进程数

=3，则系统性能良好，

=4，表示可以接受

=5，则系统性能问题严重

上面例中的8.13,如果有2个cpu核心,则8.13/2=4.065, 此系统性能可以接受

建议设置严格的报警值为: CPU核心的数量

比如：CPU核心数量为2，则设置报警值为2

(3)top

[[email protected] ~]#top 

top - 10:31:45 up14:51, 3 users, load average: 0.07, 0.33, 0.33 

Tasks: 91 total, 1running, 90 sleeping, 0 stopped, 0 zombie 

Cpu(s): 0.0%us,0.2%sy, 0.0%ni, 99.8%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st 

Mem: 502288ktotal, 494648k used, 7640k free, 220k buffers 

Swap: 1015800ktotal, 21792k used, 994008k free, 238468k cached

从top 要看CPU负载情况，可以看%us和%sy，其中%us =70%, %sy =35%,

%us+%sy =70%说明状态良好，同时可以结合idle值来看，也就是%id，如果%id =70% 则表示IO的压力较大

查看某个进程占用的CPU资源

二、Memory

1、良好状态指标

swap in （si） == 0，swap out （so） == 0

应用程序可用内存/系统物理内存 = 70%

2、监控工具

（1）vmstat

三、磁盘IO

1、良好状态指标

iowait % 20%

提高命中率的一个简单方式就是增大文件缓存区面积，缓存区越大预存的页面就越多，命中率也越高。

Linux 内核希望能尽可能产生次缺页中断（从文件缓存区读），并且能尽可能避免主缺页中断（从硬盘读），这样随着次缺页中断的增多，文件缓存区也逐步增大，直到系统只有少量可用物理内存的时候 Linux 才开始释放一些不用的页。

2、监控工具

(1)cat/proc/meminfo

这台机器总共有 256MB 物理内存（MemTotal），90MB 左右可用内存（MemFree），8MB左右用来做磁盘缓存（Buffers），40MB左右用来做文件缓存区（Cached）。

(2)sar

await表示平均每次设备I/O操作的等待时间（以毫秒为单位）。

svctm表示平均每次设备I/O操作的服务时间（以毫秒为单位）。

%util表示一秒中有百分之几的时间用于I/O操作。

如果svctm的值与await很接近，表示几乎没有I/O等待，磁盘性能很好，如果await的值远高于svctm的值，则表示I/O队列等待太长，系统上运行的应用程序将变慢。

如果%util接近100%，表示磁盘产生的I/O请求太多，I/O系统已经满负荷的在工作，该磁盘可能存在瓶颈。

(3)iostat

%util: 一秒中有百分之多少的时间用于 I/O 操作，或者说一秒中有多少时间 I/O 队列是非空的。即 delta(use)/s/1000 (因为use的单位为毫秒) 如果 %util 接近 100%，说明产生的I/O请求太多，I/O系统已经满负荷，该磁盘可能存在瓶颈。 idle小于70% IO压力就较大了,一般读取速度有较多的wait.

同时可以结合vmstat 查看查看b参数(等待资源的进程数)和wa参数(IO等待所占用的CPU时间的百分比,高过30%时IO压力高)

四、Network IO

对于UDP

1、良好状态指标

接收、发送缓冲区不长时间有等待处理的网络包

2、监控工具

netstat

对于UDP服务，查看所有监听的UDP端口的网络情况

RecvQ、SendQ为0，或者不长时间有数值是比较正常的。

对于UDP服务，查看丢包情况（网卡收到了，但是应用层没有处理过来造成的丢包）

packet receiveerrors 这一项数值增长了，则表明在丢包

对于TCP

1、良好状态指标

对于TCP而言，不会出现因为缓存不足而存在丢包的事，因为网络等其他原因，导致丢了包，协议层也会通过重传机制来保证丢的包到达对方。

所以，tcp而言更多的专注重传率。

2、监控工具

重传率 = RetransSegs / OutSegs

至于这个值在多少范围内，算ok的，得看具体的业务了。

业务则更关注的是响应时间。

五、查看文件句柄数（文件描述符）

查看系统默认的最大文件句柄数，系统默认是1024

# ulimit -n

1024

查看当前进程打开了多少句柄数

[[email protected] ~]#lsof -n|awk {print $1,$2}|sort|uniq -c|sort -nr 125 master 1507 58 sshd 1577 48 mysqld 1451 45 qmgr 1526 45 pickup 1665 36 sshd 1100 20 rsyslogd 1064 20 init 1 19 crond 1527 18 udevd 436

其中第一列是打开的句柄数，第二列是进程ID。

本文转载自：http://lib.csdn.net/article/linux/33040

1938.html

服务器部署程序员系统优化网站设置运维

猜你喜欢

Asp.net控制Tomcat启动关闭的实现方法
大数据技术栈之-数据采集
使用jqMobi开发app基础：Side Menu详解手机开发
pytest skipif_skip的中文是什么
谁都可以在Linux系统中抓取屏幕截图（linux系统怎么截图）
【说站】python位置参数的使用注意
田渊栋：关于GPT-4的一些感想
用Linux命令安全退出MySQL（linux退出mysql）
mysql命令行基本操作详解数据库
AI拿下艺术大奖，它离文学奖还有多远？
亚马逊发布兼容MySQL的数据库引擎Aurora
Oracle中熟悉快捷键，提升工作效率（oracle中快捷键）
14位医疗AI专家齐聚一堂，「新一代人工智能院士高峰论坛」圆满落幕
用SQL Server快速去除零数据（sqlserver去除0）
小米1s连拍软件Fast Burst Camera
SQL Server 破解版：让你腾飞自我！（sqlserver破解版）

zl程序教程

当前栏目

linux 系统性能指标详解程序员

相关文章