Некоторое время назад fmadm начал заваливать сообщениями типа
External sensors indicate that a fan is no longer operating correctly.
Сообщение важное, но ребутать сервер, что бы посмотреть, что там с куллерами нельзя, так как сервер в продакшине. Такие сообщения валятся по пару раз в день и уже спустя неделю – надоели. Было принято решение (не совсем корректное, но по другому нельзя) – отключить уведомление.
В fmadm есть параметр acquit, для отключения таких уведомлений. Его можно отключить, указав FRMI, UUID, label. Последнее я так и не понял, что означает и как его использовать, поэтому решил проверить первые 2. Самым правильным решением оказалось использовать FRMI, так как UUID для каждого сообщения у меня оказался уникальным (иногда повторялся, но редко). Неясно, зачем его использовать? Осталось узнать FRMI. Для этого посмотрим вывод команды
# fmdump -v ... Jul 22 16:47:11.6340 ef662208-5f0c-e8b7-e656-f72f1097deaf FMD-8000-4M Repaired 100% fault.fan.failed Repair Attempted Problem in: hc://:chassis-mfg=Supermicro:chassis-name=X9DRW:chassis-part=To-Be-Filled-By-O.E.M.:chassis-serial=0123456789/chassis=0/fan=3 Affects: - FRU: hc://:chassis-mfg=Supermicro:chassis-name=X9DRW:chassis-part=To-Be-Filled-By-O.E.M.:chassis-serial=0123456789/chassis=0/fan=3 Location: FAN 3 ...
Так вот, FRU как раз и является FRMI, который требуется указать. Делаем:
# fmadm acquit "hc://:chassis-mfg=Supermicro:chassis-name=X9DRW:chassis-part=To-Be-Filled-By-O.E.M.:chassis-serial=0123456789/chassis=0/fan=3"
Причём, обязательно в кавычках, ввиду наличия спецсимволов, которые могут интерпретироваться оболочкой.