Ru-Board.club
← Вернуться в раздел «Магнитные носители информации»

» Ремонт накопителей Seagate. Часть 6

Автор: vlad_sarov
Дата сообщения: 11.03.2015 18:58
tomset


Цитата:
Кроме понятий высокая-средня-низкая ни где ничего не пишут.


А этого никто и не напишет.
Надо точно знать надёжность каждого диска в системе, а она не известна и не будет известна.
Поэтому и не будет точного расчёта.
Автор: tomset
Дата сообщения: 11.03.2015 19:09
Общий кофицент надежности известен для партии, для одного он не имеет смысла.
Расчитывается по MTBF.
Приблизительно для всех дисков коефициент порядка 0.95 в год
т.е. 5 из 100 ожидается что могут сдохнуть.

Т.е. для массива из 2 дисков коэффициент надежности, 0,95х0.95 = ~0.9
Для трех ~0,85
А так как, например RAID 5 из трех дисков может работать без одного диска.
То его коефициент надежности равен коэффициенту надежности 2х дисков.
0.9
А это явно хуже чем у одного диска.
Но есть кард бланш,
Вовремя заметить и заменить отказавший диск, чего часто не происходит. Админ например был в отпуске.
т.е. надежность начинает зависеть от качества обслуживания.
Автор: vlad_sarov
Дата сообщения: 11.03.2015 19:13

Цитата:
Расчитывается по MTBF.


Ну давайте вспомним модель Дятлов или поближе "Муху СС", может и сами вспомните ещё чего
это MTBF учитывает?

А статистика по производителя не радует. И 0,95 это вы им много дали.

вот например тут

http://habrahabr.ru/post/237887/
Автор: tomset
Дата сообщения: 11.03.2015 19:21
vlad_sarov
А это уже относится к теории вероятности каких то событий, не связанных с качеством харда.
Ошибка программиста, как с мухой CC, которая проявилась только при массовой эксплуатации.
Раньше ее обнаружить не смогли.
Кирпич на хард упал и т.д. и т.п.
Автор: vlad_sarov
Дата сообщения: 11.03.2015 19:24
tomset


Цитата:
не связанных с качеством харда.

Качество харда в том числе определяется всем.
И качеством комплектующих и качеством микропрограммы.
Почему Вы готовы простить ошибку программиста.
Сколько винтов выкинули из-за неё?

А статистика по разным винтам разных размеров и разных фирм к чему относится?
Статистика вполне современна.
Автор: tomset
Дата сообщения: 11.03.2015 19:37
vlad_sarov
Так в том то и сложность, что статистка может быть собрана только в конкретных условиях. Только экстрасенсы, если им верить, могут угадать судьбу каждого конкретного диска. В будущее увы невозможно заглянуть.
Поэтому используют предсказание на основе собранной статистики, в каждом конкретном случае.
Расчет надежности при испытаниях на заводе верен только для условий завода. В каждой фирме и каждом доме она будет своя.


Добавлено:

Цитата:
Сколько винтов выкинули из-за неё?

Конкретно из за Мухи ни одного, десятки еще работают, причем не перепрошитые.
Муха она, как индикатор плохих условий работы.
Мешают харду работать, она проявляется.
Не мешают - работает, как часики.
Собственно она по сути спасла массу хардов от неминуемой гибели из-за плохих условий работы.
Все кто их перепрошил, исправил ошибку, а условия работы так и остались плохие - уже потеряли свои харды.
А у кого условия нормальные, они даже не знают, что есть какая-то муха
Автор: vlad_sarov
Дата сообщения: 11.03.2015 19:47
tomset



Цитата:
Сколько винтов выкинули из-за неё?

На самом деле очень много.
В лучшем случае сдали по гарантии.
Моё личное мнение, что решение этой проблемы подсказала сама Seagate, что-бы с гарантией не мучатся.


Цитата:
Расчет надежности при испытаниях на заводе верен только для условий завода. В каждой фирме и каждом доме она будет своя.


Полностью с Вами согласен, но заводские тесты скоротечны и не учитывают работу диска 24/7 в течении долгого времени.
Поэтому Я доверяю больше статистике, хотя немного и запоздалой.
Да и с дисками все сложно, надо хорошо охлаждать, что не каждый "Обычный пользователь" делает
и много ещё факторов, которые влияют на его долгую жизнь.

Но у меня дома два Seagate ES.2 пострадали от "мухи", счастье стояли в RAID
И даже не работали сильно, это была файловая помойка.
А так на компьютере ребёнок поиграется, жена в соц.сетях посидит.
На них никакой нагрузки не было.
Так один выжил, а второй нет.

Вот моя личная статистика.
Автор: tomset
Дата сообщения: 11.03.2015 20:01
vlad_sarov
Вот именно что конкретно твоя статистика.
А у меня их ровно 10 живых осталось, постоянно используются под копии, а было наверное штук 40, часть продал, раздал, зажали с данными
Все восстановленные после мухи, ни одного нового не покупал, все по бросовой цене как неисправные.
Сдохло из хороших наверное пару штук за шесть лет, но они уже попали ко мне неисправные.
так что на мой взгляд вполне нормальная серия, если бы не муха.
Автор: vlad_sarov
Дата сообщения: 11.03.2015 20:09
tomset

Тут спора нет.
Но надо делать скидку на то, что диски покупают не только в больших городах, но и в деревнях.
Где некому и нечем помочь, как кажется с очень простой проблемой.
Автор: Sedin
Дата сообщения: 11.03.2015 20:11
SD15 нормальные винты... у мну их много
ES.2 та же механика
Автор: vlad_sarov
Дата сообщения: 11.03.2015 20:36
Sedin

Вот только одна беда.
В вашей серии не было 1Tb пластин.
Механика может и нормальная была.
Автор: tomset
Дата сообщения: 11.03.2015 22:16

Цитата:
Вот только одна беда. В вашей серии не было 1Tb пластин.

Это как раз счастье.
На терабайтных пластинах надежность дисков пока совсем никакая.
Более-менее надежными были диски на пластинах где-то до 133GB.
Что тоже не совсем верно.
Надежность HDD она как бы волнами меняется.
Переходят на новую технологию, надежность пару лет - так себе, потом выправляется лет за пять-шесть с момента ввода технологии.
Но появляется новая технология, и процесс колебания надежности повторяется.
Автор: vlad_sarov
Дата сообщения: 11.03.2015 22:47
tomset


Цитата:
Но появляется новая технология, и процесс колебания надежности повторяется.


Это только констатирует факт, что все новые технологии отрабатывают за нас с вами счет, за счёт "Кроликов", которые в любом случае за это заплатят.

Хотите припой "говённый" в дятлах, хотите ошибки в микропрограммах, хотите не отработанные технологии производства пластин.
Нам некуда идти, только большие объёмы винтов, только хардкор.
Производители программного обеспечения этому тоже сильно способствуют.
Автор: igor_me
Дата сообщения: 12.03.2015 00:48

Цитата:
Производители программного обеспечения этому тоже сильно способствуют.

"Обычного" софта - не сильно, больше - производители игр. Это для дома, серверное ПО не в счёт, хотя чего там, оно тоже в основном не такое громоздкое. А вот когда хранят на компе видео, особенно HD - туууут можно развернуться
Автор: vlad_sarov
Дата сообщения: 12.03.2015 07:41
igor_me

Цитата:
"Обычного" софта - не сильно


Ну это как посмотреть, на сколько windows 7 распухла от Хрюши.
Я уже даже не говорю про 8-ку и 10-ку.

И чего только стоят FrameWork`и всех мастей.

Автор: tomset
Дата сообщения: 12.03.2015 14:15
vlad_sarov

Цитата:
Это только констатирует факт, что все новые технологии отрабатывают за нас с вами счет, за счёт "Кроликов", которые в любом случае за это заплатят.

А за чей счет еще производитель будет отрабатывать, окупать новые технологии.
Они производят их для того чтобы продавать и окупать вложения.

Такое положение дел во всей электронной промышленности, да и не только в электронной.
Начало массового производства и продаж начинается, когда выход годной продукции не менее 60%.
Затем года за 4-6, доля годной продукции доводится до 90-95%.
100% она ни когда не достигает.
Проверить каждый диск на 100% за разумное время - невозможно.
Поэтому часть плохой продукции всегда будет попадать в продажу.
Для этого и существует обмен по гарантии.
Но больше всего изделий ломается из-за условий эксплуатации.
Порядка 90% всех отказов, по вине условий эксплуатации или неправильных действий пользователя.
Тем не менее и их меняют по гарантии.
Но все убытки из-за отказов могут покрыть только продажи, то есть мы.
Автор: tametung
Дата сообщения: 12.03.2015 16:07

Цитата:
Но все убытки

Есть диск на дату.вскрытый Wyatt,8415180. Люди готовы отправить в мск.
Если возьметесь цену и контакты бросьте плз.в личку.
Может еще кто-нить захочет учайствовать в тендере ?
Автор: NiTr0
Дата сообщения: 12.03.2015 18:26
tomset

Цитата:
Коэффициенты надежности всех компонентов (по теории) - перемножаются, даже не складываются.

Не всегда.


Цитата:
Т.е. для массива из 2 дисков коэффициент надежности, 0,95х0.95 = ~0.9
Для трех ~0,85
А так как, например RAID 5 из трех дисков может работать без одного диска.
То его коефициент надежности равен коэффициенту надежности 2х дисков.
0.9

Дураки наверное в космос тройное резервирование с мажоритарной логикой делали - оно же менее надежно, чем одиночный нерезервируемый агрегат

Какова вероятность одновременного выхода из строя двух дисков из трех в промежутке времени, скажем, 2 дня? Выше или ниже, чем вероятность выхода из строя одиночного диска?
Автор: tomset
Дата сообщения: 12.03.2015 22:08
NiTr0
Почему сразу двух?
Для начала одного,
Вероятность поломки любого ~0.15 при трех дисках
Затем остается только два - вероятность поломки любого ~0.10
Возникает опасный период, пока первый не заменили.
Чувствуете, что слабое место переместилось на вероятность присутствия человека и наличие запасного диска.

Хорошо если в конторе несколько людей, которые заменят первый диск.
А если ты один, уехал куда-то надолго, а компьютер оставил включенным. Приезжаешь, а все уже свершилось.
Все таки вероятность поломки одного диска 0.05 в два раза меньше, чем вероятность поломки 0.10 для любого из 2-х дисков.
При наличии резервной копии на дисках неработающих в одной системе, надежность значительно выше
формула надежности для двух дисков в разных системах (параллельных):
1-(1-0,95)*(1-0,95) = 1-0.0025 =0.9975
Вояки и космос использует в основном, как раз дублирующие - параллельные системы.
А не одну систему с избыточностью.
Автор: NiTr0
Дата сообщения: 13.03.2015 02:39

Цитата:
Почему сразу двух?
Для начала одного,


Да потому что никого не интересует, с какой вероятностью откажет любой из дисков в произвольный момент времени. Проблема возникает только тогда, когда отказывают два диска из массива, причем - за весьма короткий (сравнительно с временем жизни) период.
Вероятность того, что у 2 монет выпадут решки, в 2 раза ниже вероятности того, что у одной монеты выпадет решка. А следуя вашей логике - вероятность должна быть выше


Цитата:
А если ты один, уехал куда-то надолго, а компьютер оставил включенным. Приезжаешь, а все уже свершилось.

Если в компьютере будет один диск - вероятность того, что он загнется, на несколько порядков больше, чем вероятность развала рэйд-массива. Так что пример не в тему.


Цитата:
Вояки и космос использует в основном, как раз дублирующие - параллельные системы.
А не одну систему с избыточностью.

Мажоритарная логика - это таки системы с избыточностью. Нельзя параллельными системами управлять полетом при всем желании. Одна система захотела лететь влево, вторая - вниз, кто из них прав, и кто будет рулить? Обе?
Автор: tomset
Дата сообщения: 13.03.2015 02:57

Цитата:
Мажоритарная логика - это таки системы с избыточностью. Нельзя параллельными системами управлять полетом при всем желании. Одна система захотела лететь влево, вторая - вниз, кто из них прав, и кто будет рулить? Обе?

Не так там все.
я сам на командном пункте ПВО служил и обслуживал вычислительный комплекс.
Одна ЭВМ управляет, а вторая только получает данные о тактической обстановке.
Сбойнула/сломалась одна, управление переходит на вторую машину.
И так вся система включает в себя по два общих локатора, по два дивизиона с двумя локаторами и двумя ракетами на каждую цель.
т.е.100% резерв, который включается в месте с основным и в любую секунду готов принять на себя управление. Тактические данные передаются на резервную систему, каждые 1-30 сек. В зависимости от важности.
Автор: vlad_sarov
Дата сообщения: 13.03.2015 07:41
tomset

Цитата:
Вероятность поломки любого ~0.15 при трех дисках
Затем остается только два - вероятность поломки любого ~0.10


Если коэффициент надёжности одиночного диска 0.95,
то и вероятность отказа любого из трёх дисков массива 0.05
Вероятности отказов не складываются, хотя Вы писали, что перемножаются.


А вот если перемножить вероятности отказа сразу двух дисков, то получится 0,0025, но никак не 0.10

Чем отличаются три одиночных диска, от трёх дисков в массиве?
Автор: tomset
Дата сообщения: 13.03.2015 15:44
vlad_sarov
Смотрите формулы, теорию не я придумывал.

вероятность отказа системы = 1 - вероятность успешной работы системы = 1-P1*P2 = 1-(1-N1)*(1-N2)

Где
P- коэффициент надежности
N - коэффициент отказа


Цитата:
то и вероятность отказа любого из трёх дисков массива 0.05

Любого, но они работают в месте в одной системе.
Автор: vlad_sarov
Дата сообщения: 13.03.2015 17:08
tomset

Традиционно производители указывают параметр MTBF – среднее время между отказами.
Вычисление AFR из MTBF – очень простой шаг. Вот формула:

Формула для RAID

AFR = 1-e^(OT/MTBF)

где OT – время работы диска в течении года. Мы исследуем надежность RAID – массивов, и предполагаем, что массив работает круглосуточно, то есть OT=24*365=8760 (число часов в году).

Типичные MTBF для жестких дисков в сотни раз больше, чем 8760. Поэтому формулу для вычисления AFR можно упростить, пользуясь разложением степенной функции в ряд Тейлора.

AFR=8760/MTBF – этой формулой мы и будем пользоваться для вычислений.


Например, для диска WD Caviar Blue указан параметр MTBF=650 000 часов. Довольно большой срок, но это не значит, что среднее время работы диска составит 74 года. Это статистический параметр и в практических целях проще использовать вероятность отказа, которая связана с MTBF.

Для диска WD Caviar Blue, AFR для него равна 1,3%. Это можно трактовать так: если в организации 100 дисков, то раз в год один придется менять.

Пользуясь теорией вероятности, вычислим AFR(RAID) – годовую вероятность отказа для RAID массивов исходя из AFR одного диска, которую и обозначим как AFR:

AFR0 = AFR (RAID0) = 2*(1-AFR)*AFR+AFR^2 = 2*AFR-AFR^2
AFR1 =AFR (RAID1) = AFR^2
AFR (RAID10) = AFR0(AFR1) = 2*AFR^2 – AFR^4 =~ 2*AFR^2
AFR5 = AFR (RAID5) = 1 — (N*AFR*(1-AFR)^(N-1) + (1-AFR)^N) =~=~ 1/2*N*(N-1)*AFR^2 — 1/3*N*(N-1)*(N-2)*AFR^3 ,где N – число дисков в массиве (от 3 до 16)
AFR (RAID50) = 2*AFR5 – AFR5^2 =~ N*(N-1)*AFR^2

Для примера с WD Caviar Blue вычислим вероятность того, что массив выйдет из строя и все данные будут утеряны:

AFR(RAID0) = 2.7%
AFR(RAID1) = 0.02%
AFR(RAID10) = 0.04%
AFR(RAID5 из 3х дисков) = 0.05%
AFR(RAID5 из 5и дисков) = 0.18%
AFR(RAID5 из 8и дисков) = 0.48%

Ради интереса, AFR(RAID5 из 16и дисков) = 1.9% — что выше, чем у исходного диска.

На практике оказывается, что число заменяемых дисков (по результатам сервисных журналов) больше, чем показатель AFR. Этот показатель называется ARR – среднегодовой показатель возвратов. Основываясь на исследованиях дата-центров можно полагать, что на практике AFR может оказаться в 2 раза выше, чем полученная из MTBF.
Некоторые производители идут на маркетинговый ход – подразумевая, что диск некорпоративного уровня используется 8 часов в сутки, они указывают AFR, который получается в 3 раза меньший, по сравнению с расчетом из формулы AFR=8760/MTBF
После года использования AFR дисков увеличивается приблизительно в 3 раза
Есть еще один показатель отказоустойчивости диска UER – уровень невосстановимых ошибок. Диски для домашнего применения имеют UER=10^-14, это значит, что ожидается один ошибочный бит на 10^14 бит = 11,6 Tb. Для корпоративных дисков UER = 10^-16..10^-15. Этот показатель следует принимать во внимание при оценке надежности восстановления данных в RAID5. По некоторым данным, вероятность сбоя при восстановлении RAID5 из 8и дисков по 2Tb составит более 50%, если использовать диски с UER=10^-14. Это, впрочем, не означает, что все данные будут потеряны. Ошибочным в этом случае получится только один блок, что может в некоторых случаях оказаться критичным.
RAID5 может перестраиваться довольно долгое время. Например, восстановление массива из дисков по 2TB может занимать до двух дней при использовании RAID контроллера. Если RAID «софтверный», то скорость восстановления может оказаться еще в два раза ниже. И если за это время произойдет сбой хотя бы одного диска, данные окажутся потеряны.

В период восстановления AFR системы RAID5 из 8 дисков = 1-(1-AFR)^8=10.3% – то есть в период восстановления RAID5 особо уязвим.
Автор: Sedin
Дата сообщения: 13.03.2015 17:59
... вам не кацца, что Ваши чудесные рассказы... к сигейтам вабще нифига не относятся?
Хотите поговорить о надёжности рейдов\винтов... создайте тему... и "меряетесь" там скока хотите ... мож кому и будет интересно.
Автор: vlad_sarov
Дата сообщения: 13.03.2015 18:06
Sedin

Мне казалось, что админы нас уже давно должны были забанить, за флуд.

Хорошо вернёмся к кроликам, вот на ES.2 попробовал эти команды

F3 T>r93
И жмем принять файл в YMODEM protocol. Это будет Saved Mode Global Data file.
F3 T>r93,,1
И жмем принять файл в YMODEM protocol. Это будет Saved Mode Global Data file копия 1.
F3 T>r94
И жмем принять файл в YMODEM protocol. Это будет Current Mode Global Data file.
F3 T>r95
И жмем принять файл в YMODEM protocol. Это будет Default Mode Data file (собсно то, что по F,,22).

Все говорят, Invalid Diag Command

Что-бы это значило?
Не все F3 одинаково полезны?
Автор: Sedin
Дата сообщения: 13.03.2015 18:23
так этож "11" рыба... (из серии... ну терминал тока в оверлее на блинах)
на ней Т>r ваще нету такой команды...
я хз... кто это советовал? или советовали не к ней конкретно?
Автор: vlad_sarov
Дата сообщения: 13.03.2015 18:26
Sedin

Совет от AntiMember на 103 странице, но только не мне.
Я просто решил попробовать.
Автор: Sedin
Дата сообщения: 13.03.2015 18:39
ясно
не... это уже к более новым аппаратам
Автор: vlad_sarov
Дата сообщения: 13.03.2015 18:43
Sedin

А с более старых есть возможность прочитать?
Или только спец-аппараты?

Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126

Предыдущая тема: Чем лучше подключать HDD от прошлого ноута и как найти папку


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.