hvostat: Jeeslaya (Default)
Очаровательная [livejournal.com profile] murav1ik недавно столкнулась с интересной ситуацией с HP-шными серверами.

Далее цитирую:
"Недавно столкнулась со странной ситуацией на сервере HP Gen6: он беспричинно выключился, а после включения поработал минут 30 и снова устал. И не просто сервер, а главный VM-хост. По законам жанра, случилось это в выходные, ровно в тот момент, когда я ехала в автобусе.

Прямо-таки ощущая, как седеют волосы, полезла в системные логи. Ничего объясняющего такое поведение не было. Проверила RAID-контроллер и диски, - всё отлично, все здоровые.
После очередной перезагрузки докопалась до iLo-логов и увидела странное:
System overheating (Temperature Sensor 29, Location System, Temperature 61C)

Описаний сенсоров для серверов HP - куча, еле нашла, что Sensor 29 - это вроде как северный мост. И что таким образом он сигнализирует о перегреве дисков. Что за мистика, я же своими глазами видела, что они в порядке!..

Первым делом отключила в BIOS автоматическую перезагрузку при перегреве. В нормальной ситуации так делать нельзя, конечно, но конкретно в моем случае сообщений от других термосенсоров не было.

Погуглила. На одной из страниц вышла на старенький сайт дядечки по имени David A. Soussan, который много работал с разным железом и с нетоповыми серверами HP в частности. Подытоживая свой опыт, он написал целую статью о проблеме, с которой я столкнулась.

Оказывается, "неродные" SATA-диски часто отправляют информацию о своём состоянии в формате, который датчик не может распознать. И поэтому он на всякий случай считает, что диски перегреваются. Охлаждение включается на полную мощность, но, естественно, не помогает, и через короткое время система получает сигнал о перегреве и аварийно отключается.
Дэвид подробно описал проблему и даже составил табличку совместимых/несовместимых дисков:
http://dascomputerconsultants.com/HPCompaqServerDrives.htm
Стоит ли говорить, что в табличке несовместимых купленные нами для бэкапов HGST диски стояли на первом месте. =)) Удивительно, как они вообще полгода проработали нормально.

У кого-то сервер с такими дисками может не включиться совсем:
https://community.hpe.com/t5/ProLiant-Servers-ML-DL-SL/HP-DL370-G6-Overheated-SATA-Drives/td-p/4581621

Понятно, что самое правильное решение проблемы - это покупать только "родные" HP диски. Но если хочется сэкономить, то будьте очень внимательны.

P.S.: Дэвид, спасибо тебе, мужик, где бы ты ни был. =)

Конец цитаты.

__
hvostat: Jeeslaya (Default)
Столкнулся с задачей заменить RAID-контроллер в сервере DL360 G5.
Как известно, конфигурация массива хранится на самих жестких дисках, поэтому замена контроллера не приводит к развалу сконфигурированных массивов.


Официальный гайдлайн таков:
1) Выключить сервер.
2) Подключить новый RAID-контроллер
3) Включить сервер.
3) Установить драйвера.
4) Выключить сервер.
5) Отключить разъемы. Вынуть старый RAID-контроллер.
6) Переключить разъемы в новый RAID-контроллер.
7) Включить сервер, проверить boot device в BIOS.
8) ???
9) PROFIT!

Однако, всё было бы отлично, если бы у меня были полноценные контроллеры 200-й серии.
Но конкретной в этой машине стоял самый младший e200i с 64 МБ кэша.
А заменить его предполагалось на p200i уже с 256 мб кэша и батарейкой.

Порт для подключения таких контроллеров там всего ОДИН, соответственно, официальная инструкция неприменима.

Решение:
0) Сделать ПОЛНЫЙ БЭКАП сервера.
1) Выключить сервер.
2) Отключить диски, вынуть старый RAID-контроллер.
3) Подключить новый RAID-контроллер, подключить диски.
4) Включить сервер, зайти в BIOS и проверить настройки boot device в BIOS.
5) Загрузить Windows в безопасном режиме.
6) Форточка "продумается" и установит стандартный драйвер (media driver) для контроллера, после чего перезагрузится.
7) Загрузить систему в обычном режиме.
8) Установить родной драйвер из SPP или в ручном режиме.
9) ???
10) PROFIT!!!

_
hvostat: Jeeslaya (Default)
Есть HP-шная SSD-шка, 100GB 2.5"(SFF) Enterprise Mainstream SSD Part. number 691862-B21.
Я озадачился её ресурсом.

HP заявляет, что в серии Mainstream Endurance живучесть составляет "10 DWPD". Т.е. 10 перезаписей в день.
Цитирую "Represents number of full rewrites of drive “surface” per day for five years using 100 percent random 4 KiB writes."

Сегодня попала ко мне в цепкие лапы.

А внутри у неё, как оказалось, неонка - Intel SSD DC S3700. (SSDSC2BA100G3P)
И, что интересно, Intel слово-в-слово повторяет слова HP (хотя, скорее, наоборот) - "10 drive writes per day for five years".

__
hvostat: Jeeslaya (Default)
1) Ставим 2012 с графической оболочкой
2) Инсталлируем фичу: SNMP Service
3) Скачиваем SPP с сайта HP:
HP_Service_Pack_for_Proliant_2013.02.0-0_725490-001_spp_2013.02.0-SPP2013020B.2013_0628.2.iso
4) Качаем Microsoft Windows Server 2012 Supplement for HP Service Pack for ProLiant:
MSsupplement2012.exe
5) Распаковываем MSsupplement2012.exe в папку C:\Win2012\ (например).
6) Качаем HP ProLiant Integrated Lights-Out Management Interface Driver for Windows Server 2003/2008 x64 Editions:
cp016017.exe
7) Качаем HP ProLiant Smart Array SAS/SATA Controller Driver for Windows Server 2012:
cp018436.exe
8) Инсталлируем драйвера из п.п. 6 и 7. Если система дала отлуп "hardware not found" или "OS version not supported" - распаковываем архивы и ставим драйвера вручную через devmgmt.msc. Перезагружаем сервер, если необходимо.
9) Монтируем образ SPP (из п.3)
10) Запускаем \hp\swpackages\hpsum.exe
11) Кроме дефолтного репозитория добавляем FTP и папку с содержимым из MSsupplement2012.exe. Жмачим next.
12) Localhost добавляется автоматически. Добавляем другие хосты, если необходимо. Жмачим next. Смотрим, как проходит self discovery.
13) Проверяем, нет ли failed dependencies:
14.1) Если есть - проверяем, какие устройства остались из драйверов и ставим их как в п.8.
14.2) Если всё в порядке жмачим next.
15) Проверяем, всё ли ок.
16) Перезагружаем сервер.
17) PROFIT!!!

__
hvostat: Jeeslaya (Default)
При попытке запустить Hypervisor на вышеназванном сервере получаем отлуп:
"Hypervisor launch failed; Processor does not provide the features necessary to run the hypervisor (leaf 0x80000001, register 0x3: features needed 0x20100800, features supported 0x20000800)."

В сервере установлен один процессор Intel Xeon Е5405, VT-x поддерживается.
В BIOS виртуализация, разумеется, включена.

Решение:
1) Устанавливаем/проверяем в BIOS установку следующих параметров:

Security > Execute Disable (set to On).
Performance > Virtualization (set to On).
Performance > VT for Direct I/O Access (set to On).
Performance > Trusted Execution (set to Off).
The virtualization technology > Еnabled.
Hardware-enforced Data Execution Prevention (DEP) > Еnabled.

2) Теперь самое интересное: после установки необходимых параметров, сохраняем настройки и обязательно ВЫКЛЮЧАЕМ(!!!) сервер.
3) Даём остыть 1-2 минуты.
4) Включаем сервер.
5) Profit.
hvostat: Jeeslaya (Default)


Поступила задача: объединить в высокоскоростную сеть несколько рабочих станций + 1 сервер. 100 мбит - недостаточно.

Проанализировал наличие доступных железок на рынке (к слову, о наших, в смысле украинских интернет-магазинах я могу написать отдельный пост, но он будет на 50% состоять из русского мата) и увидел, что их всего три:
Два HP:
HP 1405–8G
HP 1410–8G
И недокошка:
LinkSys SE2800–EE

Цена примерно одинакова у всех ~62 доллара.
1405-й исключил как игрушечный, LinkSys же самый дорогой, но ни по конструктиву, ни по содержимому ничем в лучшую сторону не отличается от собратьев.
Методом исключения выбираем HP 1410.
Также, лично меня (всегда стараюсь иметь резерв и план "Б") подкупила фраза "гарантия 60 месяцев с заменой на следующий день".

подробнее + фотографии )

Profile

hvostat: Jeeslaya (Default)
hvostat

June 2017

S M T W T F S
    123
45678910
11121314151617
181920212223 24
252627282930 

Syndicate

RSS Atom

Style Credit

Expand Cut Tags

No cut tags
Page generated 20 September 2017 02:12
Powered by Dreamwidth Studios