hvostat: Jeeslaya (Default)
Очаровательная [livejournal.com profile] murav1ik недавно столкнулась с интересной ситуацией с HP-шными серверами.

Далее цитирую:
"Недавно столкнулась со странной ситуацией на сервере HP Gen6: он беспричинно выключился, а после включения поработал минут 30 и снова устал. И не просто сервер, а главный VM-хост. По законам жанра, случилось это в выходные, ровно в тот момент, когда я ехала в автобусе.

Прямо-таки ощущая, как седеют волосы, полезла в системные логи. Ничего объясняющего такое поведение не было. Проверила RAID-контроллер и диски, - всё отлично, все здоровые.
После очередной перезагрузки докопалась до iLo-логов и увидела странное:
System overheating (Temperature Sensor 29, Location System, Temperature 61C)

Описаний сенсоров для серверов HP - куча, еле нашла, что Sensor 29 - это вроде как северный мост. И что таким образом он сигнализирует о перегреве дисков. Что за мистика, я же своими глазами видела, что они в порядке!..

Первым делом отключила в BIOS автоматическую перезагрузку при перегреве. В нормальной ситуации так делать нельзя, конечно, но конкретно в моем случае сообщений от других термосенсоров не было.

Погуглила. На одной из страниц вышла на старенький сайт дядечки по имени David A. Soussan, который много работал с разным железом и с нетоповыми серверами HP в частности. Подытоживая свой опыт, он написал целую статью о проблеме, с которой я столкнулась.

Оказывается, "неродные" SATA-диски часто отправляют информацию о своём состоянии в формате, который датчик не может распознать. И поэтому он на всякий случай считает, что диски перегреваются. Охлаждение включается на полную мощность, но, естественно, не помогает, и через короткое время система получает сигнал о перегреве и аварийно отключается.
Дэвид подробно описал проблему и даже составил табличку совместимых/несовместимых дисков:
http://dascomputerconsultants.com/HPCompaqServerDrives.htm
Стоит ли говорить, что в табличке несовместимых купленные нами для бэкапов HGST диски стояли на первом месте. =)) Удивительно, как они вообще полгода проработали нормально.

У кого-то сервер с такими дисками может не включиться совсем:
https://community.hpe.com/t5/ProLiant-Servers-ML-DL-SL/HP-DL370-G6-Overheated-SATA-Drives/td-p/4581621

Понятно, что самое правильное решение проблемы - это покупать только "родные" HP диски. Но если хочется сэкономить, то будьте очень внимательны.

P.S.: Дэвид, спасибо тебе, мужик, где бы ты ни был. =)

Конец цитаты.

__
hvostat: Jeeslaya (Default)
Тяжко жить интеграторам.
А когда еще и заказчики за бугром...

Постоянно приходится фразу "Какого хера?!" переводить как "Could you please explain ..."
А "Сраные кретины" как "Dear Helpdesk team"

_
hvostat: Jeeslaya (Default)
Битва львов и крокодилов за тушу дохлого жирафа — пример тупиковой ситуации.
Львы слишком быстры для крокодилов. Шкура крокодилов слишком толстая для львов.
Крокодил не может схватить льва на суше.
Укусы льва безвредны для крокодила.
Все жрут жирафа коллективно, но в обстановке повышенной нервозности.
Жираф - безразличен к происходящему.
©

_
hvostat: Jeeslaya (Default)
Много думал. Разработал план устойчивого развития России на ближайшие десять лет.
Остается не решенной мелкая техническая деталь.
Раз в 4 дня каким-то образом надо взрывать по одной мексиканской нефтяной платформе.

© И. Рудь

_
hvostat: Jeeslaya (Default)
Фраза дня:
"кретинизм подконтрольного планктона и колоний простейших"

© [livejournal.com profile] syswipe

Profile

hvostat: Jeeslaya (Default)
hvostat

June 2017

S M T W T F S
    123
45678910
11121314151617
181920212223 24
252627282930 

Syndicate

RSS Atom

Style Credit

Expand Cut Tags

No cut tags
Page generated 27 July 2017 08:38
Powered by Dreamwidth Studios