linux 服务器 cpu 使用率

nux服务器 CPU使用率可通过top、uptime等命令实时监控，反映单位时间内非空闲时间占比，是衡量系统负载的核心指标

Linux服务器CPU使用率监控与分析指南

工具名称	功能特点	典型参数示例	输出解读要点
`top`	实时动态显示进程级资源占用情况	`h/H`隐藏线程/显示线程；`P`按CPU排序	PID、%CPU列直接反映单个进程的CPU消耗百分比
`htop`	增强版top（需安装），支持彩色界面和垂直滚动条	F5进入树状模式展示进程关系	可直观查看进程父子层级关系
`mpstat`	统计多核CPU的整体利用率（来自sysstat包）	`-P ALL`显示所有逻辑处理器数据	`%idle`越低说明系统越繁忙
`sar -u`	历史数据采集分析工具，适合排查周期性性能波动	`-f /var/log/sa/saXX`加载历史记录	关注`user/nice/system/idle`四者的占比变化规律
`vmstat 1 5`	每秒刷新一次系统级指标（运行队列长度、上下文切换次数等）	间隔时间设为1秒共执行5次	`r`列>cpu核心数表明存在严重等待现象
`ps -eo %cpu,pid,cmd --sort=-%cpu \| head`	快速定位高耗能进程	管道组合实现排序过滤	首行即为当前最消耗CPU的应用及其PID

发现CPU持续高位 → 执行以下步骤：
1️⃣ top找出具体进程PID
2️⃣ strace追踪该进程系统调用频率
3️⃣ perf record -g <PID>进行热点函数分析
4️⃣ dmesg检查是否有驱动报错日志
5️⃣ free确认是否存在内存不足引发的交换行为

现象特征	根本原因推测	解决方案示例
某Java进程长期占满单核	JVM垃圾回收机制不合理	调整堆内存参数+启用G1收集器
ksoftirqd线程CPU飙升	网卡中断模式设置为MSI-X失效	echo ‘on’ > /proc/sys/net/core/netdev_budget_usecs
pdflush进程反复唤醒	Dirty Page过多导致写回延迟	增大vm.dirty_ratio值减少强制刷盘频率
kernel:sched频现日志	CPU亲缘性设置不当造成迁移开销	taskset命令绑定特定物理核心运行关键进程