Support for monitoring hardware power consumption
Kontekst
Zespół OWE projektu CAISE potrzebuje monitorować zużycie energii przez komponenty serwera.
Cel
Dodać inputy intel_powerstat
oraz nvidia_smi
.
Konfiguracja
Konfiguracja inputów
[[inputs.intel_powerstat]]
package_metrics = ["current_power_consumption", "current_dram_power_consumption"]
[[inputs.nvidia_smi]]
fieldpass = ["power_draw"]
Konfiguracja kontenera
--volume /usr/bin/nvidia-smi:/usr/bin/nvidia-smi:ro
--volume /lib/x86_64-linux-gnu/libnvidia-ml.so.1:/lib/x86_64-linux-gnu/libnvidia-ml.so.1:ro
Implementacja
Pewnym problemem są te mounty, bo one na różnych systemach mogą wyglądać trochę inaczej - widzę trzy wyjścia:
-
Wystawić zmienną
telegraf_additional_mounts
i ustawiać ją w playbooku na wartości adekwatne dla danego środowiska. -
Ustawić to na sztywno i martwić się dopiero, jak będzie problem.
-
Próbować zrobić jakieś autowykrywanie tych ścieżek - może być trochę problematyczne.
Dla mnie najwygodniejsza byłaby chyba opcja 1.
Edited by Tomasz Ziółkowski