Linux:监控GPU状态【nvidia-smi】【watch -n 1 nvidia-smi】【pip install gpustat;gpustat -i】
2023-09-27 14:20:40 时间
一台服务器毕竟很多人都在用,这个时候查看GPU状态显得尤为重要(查看剩余显存大小,以便自己能否使用这块卡)
后来查找发现有2种方式,最开始我用的就是第一种,但是显然不是很好用,最后发现gpustat超级好用,下面分别介绍两种用法
一、nvidia-smi
nvidia-smi是 Nvidia 显卡命令行管理套件,基于 NVML 库,旨在管理和监控 Nvidia GPU 设备。
下面是 nvidia-smi 命令的输出,其中最重要的两个指标:
显存占用
GPU 利用率
显存占用和 GPU 利用率是两个不一样的东西,显卡是由 GPU 计算单元和显存等组成的,显存和 GPU 的关系有点类似于内存和 CPU 的关系。
nvidia-smi
实时监测
watch -n 1 nvidia-smi
二、gpustat
gpustat, 直接 pip install gpustat
即可安装,gpustat 基于nvidia-smi,可以提供更美观简洁的展示,结合 watch 命令,可以动态实时监控 GPU 的使用情况。
gpustat -i
watch --color -n 1 gpustat -cpu
相关文章
- Linux下性能监控、守护进程与计划任务管理
- Linux服务器性能监控利器-Nmon实战
- Collectl: Linux 性能监控的全能冠军
- 使用 Ganglia 对 Linux 网格和集群服务器进行实时监控
- 在linux中如何通过nload来监控网络使用情况
- Linux 上网络监控工具 ntopng 的安装
- Inxi:获取Linux的系统和硬件信息
- LFCS 系列第十四讲: Linux 进程资源用量监控和按用户设置进程限制
- 用 Netdata 监控 Linux
- 基于Linux的机房自动化IT运维监控
- Linux atop 监控系统状态
- Linux snmp监控
- Linux下用Mytop监控MySQL资源
- bootz启动linux内核——uboot生命的终点——学习笔记
- 【linux/docker】解决ORA-28000: the account is locked
- Linux - 系统性能监控命令
- Linux基础命令总结
- Linux 内核总线注册
- Cmp- Linux必学的60个命令
- Linux watch 监控系统状态
- Cacti监控Linux主机
- Linux下Mongodb安装和启动配置
- linux 内核同步机制
- 走进Redis及入门安装(linux)
- 针对Linux集群的高级监控工具sinfo概述
- Linux资源监控(Nmon)
- Windows&Linux文件目录监控
- Linux集群监控工具简介:Ganglia和Nagios
- 理解与学习linux 文件系统的目录结构
- git diff与linux diff的输出格式之unified format
- linux编译ruby1.8.7 出现OPENSSL错误
- 对Linux系统服务器进行全面的监控,详细分析各个命令参数指标包括性能软件和硬件设备
- Linux下汇编语言学习笔记70 ---