dcgm-exporter - эспортер prometheus метрик для NVIDIA GPU DCGMhttps://github.com/NVIDIA/dcgm-exporter
Grafana дашбоард: https://grafana.com/grafana/dashboards/12239
опубликовано в @gitgate
#moni #nvidia #dcgm #exporter #prometheus
👍8🔥5
nvidia-fan-control - утилита Linux для мониторинга температуры графического процессора и динамического управления скоростью вращения вентиляторов графического процессора NVIDIA с использованием NVML.Требования:
- графические процессоры
NVIDIA с поддержкой NVML
- драйверы NVIDIA 520 или вышеhttps://github.com/ZanMax/nvidia-fan-control
опубликовано в @gitgate
#nvidia #cli #utils #moni
GitHub
GitHub - ZanMax/nvidia-fan-control: Nvidia Fan Control for linux
Nvidia Fan Control for linux. Contribute to ZanMax/nvidia-fan-control development by creating an account on GitHub.
👍10🔥6
GPU-hot - панель мониторинга
Возможности:
- показатели в реальном времени (менее секунды)
- автоматическое определение наличия нескольких графических процессоров
- мониторинг процессов (PID-регуляторы, использование памяти)
- исторические графики (использование, температура, мощность, время)
- системные показатели (процессор, оперативная память)
- масштабирование от 1 до 100+ графических процессоров
Метрики:
- использование
- температура
- память
- потребляемая мощность
- скорость вращения вентилятора
- тактовые частоты
- информация о PCIe, P-State
- состояние ограничения нагрузки
- сессии кодировщика/декодера.
https://github.com/psalias2006/gpu-hot
Опубликовано в @gitgate
#mini #nvidia #webui
SSH не требуется.Возможности:
- показатели в реальном времени (менее секунды)
- автоматическое определение наличия нескольких графических процессоров
- мониторинг процессов (PID-регуляторы, использование памяти)
- исторические графики (использование, температура, мощность, время)
- системные показатели (процессор, оперативная память)
- масштабирование от 1 до 100+ графических процессоров
Метрики:
- использование
- температура
- память
- потребляемая мощность
- скорость вращения вентилятора
- тактовые частоты
- информация о PCIe, P-State
- состояние ограничения нагрузки
- сессии кодировщика/декодера.
https://github.com/psalias2006/gpu-hot
Опубликовано в @gitgate
#mini #nvidia #webui
👍13🔥5