hvostat: Jeeslaya (Default)
[personal profile] hvostat
Очаровательная [livejournal.com profile] murav1ik недавно столкнулась с интересной ситуацией с HP-шными серверами.

Далее цитирую:
"Недавно столкнулась со странной ситуацией на сервере HP Gen6: он беспричинно выключился, а после включения поработал минут 30 и снова устал. И не просто сервер, а главный VM-хост. По законам жанра, случилось это в выходные, ровно в тот момент, когда я ехала в автобусе.

Прямо-таки ощущая, как седеют волосы, полезла в системные логи. Ничего объясняющего такое поведение не было. Проверила RAID-контроллер и диски, - всё отлично, все здоровые.
После очередной перезагрузки докопалась до iLo-логов и увидела странное:
System overheating (Temperature Sensor 29, Location System, Temperature 61C)

Описаний сенсоров для серверов HP - куча, еле нашла, что Sensor 29 - это вроде как северный мост. И что таким образом он сигнализирует о перегреве дисков. Что за мистика, я же своими глазами видела, что они в порядке!..

Первым делом отключила в BIOS автоматическую перезагрузку при перегреве. В нормальной ситуации так делать нельзя, конечно, но конкретно в моем случае сообщений от других термосенсоров не было.

Погуглила. На одной из страниц вышла на старенький сайт дядечки по имени David A. Soussan, который много работал с разным железом и с нетоповыми серверами HP в частности. Подытоживая свой опыт, он написал целую статью о проблеме, с которой я столкнулась.

Оказывается, "неродные" SATA-диски часто отправляют информацию о своём состоянии в формате, который датчик не может распознать. И поэтому он на всякий случай считает, что диски перегреваются. Охлаждение включается на полную мощность, но, естественно, не помогает, и через короткое время система получает сигнал о перегреве и аварийно отключается.
Дэвид подробно описал проблему и даже составил табличку совместимых/несовместимых дисков:
http://dascomputerconsultants.com/HPCompaqServerDrives.htm
Стоит ли говорить, что в табличке несовместимых купленные нами для бэкапов HGST диски стояли на первом месте. =)) Удивительно, как они вообще полгода проработали нормально.

У кого-то сервер с такими дисками может не включиться совсем:
https://community.hpe.com/t5/ProLiant-Servers-ML-DL-SL/HP-DL370-G6-Overheated-SATA-Drives/td-p/4581621

Понятно, что самое правильное решение проблемы - это покупать только "родные" HP диски. Но если хочется сэкономить, то будьте очень внимательны.

P.S.: Дэвид, спасибо тебе, мужик, где бы ты ни был. =)

Конец цитаты.

__

Profile

hvostat: Jeeslaya (Default)
hvostat

June 2017

S M T W T F S
    123
45678910
11121314151617
181920212223 24
252627282930 

Style Credit

Expand Cut Tags

No cut tags
Page generated 23 July 2017 18:41
Powered by Dreamwidth Studios