27
Jul
2019
Autor: Andphe
En: Monitoreo
|
Algunas veces en el trabajo discutimos sobre la exactitud de las alertas de los sistemas de monitoreo (sensu, datadog, nagios, opsview, etc), de lo ruidosos que pueden ser, como mejorarlos, bromeamos, etc.
La última conversación de esas que recuerdo fue sobre el uso de CPU de unas instancias en un cluster ECS, yo traté de ilustrar mis ideas usando una analogía y creo que le sería útil a otras personas, especialmente si son managers, directores, etc (que usualmente son los que demandan aumentar el número de alertas), aquí vamos: |
Leer más...
|