Разбираемся с тем как раньше вел логи Linux: файл конфигурации демона событий, приоритеты событий, возможные действия.
Отдельно смотрим как в Linux отправлять события на другой компьютер, и как на машине Linux собрать собирать события с других ПК.
Разбираемся с системой управления журналами событий journald: как настроить и управлять получением событий в journald.
Хороший мануал на русском: www.altlinux.org/Journald
Вне зависимости от размера инфраструктуры, весьма сложно разобраться в проблемах, обнаруженных системой мониторинга, особенно если их сотни или тысячи. Они могут быть о железе, приложениях, связаны с безопасностью, тестовыми и продакшн средами, различными датацентрами и сервисами. Как эффективно управлять этой сложностью?