News:

Сложнее всего начать действовать, все остальное зависит только от упорства. Амелия Эрхарт

Main Menu

Самовольное переименование md-устройств.

Started by Юсупов Игорь, 19 May 2017, 13:09

Previous topic - Next topic

0 Members and 2 Guests are viewing this topic.

Юсупов Игорь

Доброго времени суток.
Думал, что у меня одного такая ситуация была, оказалось ещё человек несколько сталкивались с подобным. Есть сервер с несколькими md-устройствами разного типа (обычно 0 и 1, у некоторых 5 и 10 было). Как правило после обновления (а бывало и просто после перезагрузки) одно из устройств переименовывалось в md127, хотя при этом продолжало исправно работать. Поскольку ни сбоев, ни потери данных не наблюдалось, народ просто исправлял в конфигах mdx на md127 и всё дальше работало (и работает до сих пор). Кто-нибудь разбирался почему так происходит и как бороться (и надо ли)?
Современные технологии - это, конечно, хорошо ...
Но использовать то, что есть - тоже своего рода искусство.

Уваров А.С.

Начнем с того, что md127 - имя зарезервированное для аварийного массива. Поэтому в таком случае нужно обязательно разбираться в причинах и устранять их.

Юсупов Игорь

Вопрос в том где искать эти причины? Ну и почему всё продолжает исправно работать, в ряде случаев годами?
Современные технологии - это, конечно, хорошо ...
Но использовать то, что есть - тоже своего рода искусство.

Const

Quote from: Юсупов Игорь on 21 May 2017, 04:56Ну и почему всё продолжает исправно работать, в ряде случаев годами?

на одной подработке год наверное второй точно, если не третий жду развала пары рэйд-массивов, т к начальство по-факту понимает постановку перед фактом свершения события, чтобы метаться, аки макак по-полю ©, выделяя мегатонны бабла. Первый деградировал, второй просто держится на последнем живом диске. Один помирающий диск, прежде чем умереть, тихо сыпался год, а то и пару лет. Умер внезапно, после выключения блока и начала сканирования чекдиском. До этого, если не смотреть смарт - работал как обычно
Так бывает, да ) Закон подлости: критичные массивы разваливаются на ровном месте по чиху, когда нужно умереть - живут годами.
Опять же в этом месте стабильное электричество и uptime годами, всё на SMART-APC с кондеем, так что климат может сказываться

Уваров А.С.

Quote from: Юсупов Игорь on 21 May 2017, 04:56Вопрос в том где искать эти причины?

В логах.

Quote from: Юсупов Игорь on 21 May 2017, 04:56Ну и почему всё продолжает исправно работать, в ряде случаев годами?

А вы уверены, что все "исправно" работает и оба диска полностью идентичны? А то "неожиданно" может выясниться что диск с данными умер, а на втором непонятно что и непонятно какого срока давности.