При сбое питания одновременно перезагружаются все сервера и активное сетевое оборудование в стойке. При этом службы, запускающиеся от имени доменного пользователя, не стартуют. Это касается служб как на рядовых серверах, так и на контроллере домена.
The "bla-bla-bla" service failed to start due to the following error:
The account name is invalid or does not exist, or the password is invalid for the account name specified.
Если запускать службы вручную (от имени того же пользователя) через некоторое время после рестарта, то они стартуют нормально.
Почти уверен, что Керберос просто не успевает запуститься ни на одном из контроллеров домена, вследствие чего службы не могут пройти аутентификацию.
Несмотря на вводимое в эксплуатацию "гарантированное электропитание" стойки, подобные массовые перезагрузки могут повторяться.
Существует ли простое (и элегантное) решение данной проблемы?
Вот что мне самому приходит в голову:
1) скрипт, который будет пытаться запускать определенные службы по таймеру. Решение плохо тем, что при добавлении еще одной службы к проблемному списку придется править скрипт.
2) искусственно затормозить запуск всех проблемных серверов, дабы один контроллер успел загрузиться. Плохо тем, что проблема присутствует и для локальных для контроллера домена служб. Если службы, запускаемые от имени доменных пользователей, будут на обоих контроллерах, то как минимум на одном из них проблема повторится.
3) Дополнительный УПС на одном из контроллеров. Не поможет при длительном блэкауте. В таком случае все сервера все равно запускаются одновременно.
На контроллерах стоит Windows Server 2003 R2 SP2 x64, на рядовых серверах Windows Server 2003 R2 SP2 x86. Соединены все через Cisco Catalyst 4000.
Добавлено:
Поставил бесконечный рестарт служб с периодом 5 мин. в случае сбоя в свойствах на закладке Recovery.
Жду ближайшего сбоя электропитания.
The "bla-bla-bla" service failed to start due to the following error:
The account name is invalid or does not exist, or the password is invalid for the account name specified.
Если запускать службы вручную (от имени того же пользователя) через некоторое время после рестарта, то они стартуют нормально.
Почти уверен, что Керберос просто не успевает запуститься ни на одном из контроллеров домена, вследствие чего службы не могут пройти аутентификацию.
Несмотря на вводимое в эксплуатацию "гарантированное электропитание" стойки, подобные массовые перезагрузки могут повторяться.
Существует ли простое (и элегантное) решение данной проблемы?
Вот что мне самому приходит в голову:
1) скрипт, который будет пытаться запускать определенные службы по таймеру. Решение плохо тем, что при добавлении еще одной службы к проблемному списку придется править скрипт.
2) искусственно затормозить запуск всех проблемных серверов, дабы один контроллер успел загрузиться. Плохо тем, что проблема присутствует и для локальных для контроллера домена служб. Если службы, запускаемые от имени доменных пользователей, будут на обоих контроллерах, то как минимум на одном из них проблема повторится.
3) Дополнительный УПС на одном из контроллеров. Не поможет при длительном блэкауте. В таком случае все сервера все равно запускаются одновременно.
На контроллерах стоит Windows Server 2003 R2 SP2 x64, на рядовых серверах Windows Server 2003 R2 SP2 x86. Соединены все через Cisco Catalyst 4000.
Добавлено:
Поставил бесконечный рестарт служб с периодом 5 мин. в случае сбоя в свойствах на закладке Recovery.
Жду ближайшего сбоя электропитания.