Здравствуйте, коллеги!
Утро понедельника, а в выходные администратор оборудования Cisco веселился, а значит теперь и мне есть чем заняться)))
Был выключен коммутатор (единственный) в который смотрит все - шасси с блейдами на которых ESXi 5.0, и сторадж (ISCSI)
HA очевидно от всеобщей недоступности слегка офигел и звис вот в некоем состоянии, которое можно поисать так:
Все машины работают и доступны, но консоль из клиента vsphere недоступна (unable to connect to the MKS: the operation is not allowed in the current state) и бОльшая часть машин имеет такой аларм:
bstudio Warning vSphere HA virtual machine monitoring action 17.12.2012 7:37:38
В эвентах кластера такие события валятся с периодичностью 30 секунд (как и настроено было):
vSphere HA cannot reset bstudio on 192.168.11.18 in cluster sss_perm in SSS warning 17.12.2012 10:33:15 bstudio
Сделать ресет машины из клиента не выходит - выдается сообщение, что машина занята другим процессом. Ресет из гостевой ОС выполняется, через какое-то время ошибка вновь появляется, и в эвентах кластера снова видим попытки ресетить эту же машину.
Все что нашел по этому вопросу -
рекомендации странные - "игнорировать такие события", что как-то не устраивает.
Посоветуйте что сделать, чтобы кластер перестал пытаться ресетить машины? Перезагрузки хостов хотелось бы избежать...