20 Август 2017, 03:30

Цитата дня:

Не допустить ошибок, значит прожить неполноценную жизнь. Стив Джобс


Самовольное переименование md-устройств.

Автор Юсупов Игорь, 19 Май 2017, 13:09

« предыдущая тема - следующая тема »

0 Пользователей и 1 Гость просматривают эту тему.

Вниз

Юсупов Игорь

Доброго времени суток.
Думал, что у меня одного такая ситуация была, оказалось ещё человек несколько сталкивались с подобным. Есть сервер с несколькими md-устройствами разного типа (обычно 0 и 1, у некоторых 5 и 10 было). Как правило после обновления (а бывало и просто после перезагрузки) одно из устройств переименовывалось в md127, хотя при этом продолжало исправно работать. Поскольку ни сбоев, ни потери данных не наблюдалось, народ просто исправлял в конфигах mdx на md127 и всё дальше работало (и работает до сих пор). Кто-нибудь разбирался почему так происходит и как бороться (и надо ли)?
Современные технологии - это, конечно, хорошо ...
Но использовать то, что есть - тоже своего рода искусство.

Уваров А.С.

Начнем с того, что md127 - имя зарезервированное для аварийного массива. Поэтому в таком случае нужно обязательно разбираться в причинах и устранять их.

Юсупов Игорь

Вопрос в том где искать эти причины? Ну и почему всё продолжает исправно работать, в ряде случаев годами?
Современные технологии - это, конечно, хорошо ...
Но использовать то, что есть - тоже своего рода искусство.

Const

Ну и почему всё продолжает исправно работать, в ряде случаев годами?
на одной подработке год наверное второй точно, если не третий жду развала пары рэйд-массивов, т к начальство по-факту понимает постановку перед фактом свершения события, чтобы метаться, аки макак по-полю ©, выделяя мегатонны бабла. Первый деградировал, второй просто держится на последнем живом диске. Один помирающий диск, прежде чем умереть, тихо сыпался год, а то и пару лет. Умер внезапно, после выключения блока и начала сканирования чекдиском. До этого, если не смотреть смарт - работал как обычно
Так бывает, да ) Закон подлости: критичные массивы разваливаются на ровном месте по чиху, когда нужно умереть - живут годами.
Опять же в этом месте стабильное электричество и uptime годами, всё на SMART-APC с кондеем, так что климат может сказываться

Уваров А.С.

Вопрос в том где искать эти причины?
В логах.

Ну и почему всё продолжает исправно работать, в ряде случаев годами?
А вы уверены, что все "исправно" работает и оба диска полностью идентичны? А то "неожиданно" может выясниться что диск с данными умер, а на втором непонятно что и непонятно какого срока давности.

Вверх