Неисправимые логические ошибки

Как известно, любое «железное» оборудование, устанавливаемое в компьютерах, подвержено старению или износу. И жесткие диски исключением не являются. Несмотря на кажущиеся проблемы физического характера, достаточно часто можно встретить и некоторые разновидности программных сбоев, вследствие которых на дисках появляются так называемые неисправимые ошибки секторов (CrystalDiskInfo – утилита для тестирования HDD – помечает их в списке ID, присваивая значение «С6»). Даже при проведении серии тестов поверхности винчестера ошибки могут быть отнесены именно к физическим повреждениям, хотя на самом деле это и не так. Просто программы при невозможности записи или тестирования таких областей и помечают их как сбойные. Впрочем, исправить такие проблемы можно, конечно, только при условии, что винчестер действительно не начал «сыпаться» или не подвергался физическому воздействию (ударам, падению, попаданию пыли и влаги, перегреву и т. д.).

Что такое неисправимые ошибки секторов жестких дисков?

Для начала следует привести немного теоретических сведений о возможных ситуациях, связанных с появлением таких сбоев в работе оборудования. Физическую природу появления неисправимых ошибок секторов жестких дисков пока рассматривать не будем, а остановимся на понимании того, как такие сбои распознаются и интерпретируются средствами проверки. В принципе, если не брать в расчет повреждение поверхности, можно утверждать, что все основные сбои связаны с нарушениями логической структуры жестких дисков, называемой файловой системой. Действительно, программы проверки обозначают сбойные области с BAD-секторами с выдачей уведомлений об ошибках только по причине того, что не могут их прочитать. Как уже, наверное, понятно, совсем необязательно это может быть именно физическое повреждение пластин. Чаще всего такая ситуация может наблюдаться, скажем, при внезапном отключении питания или не некорректном завершении работы компьютера.

Немного теории по поводу битых секторов

Что же касается самих неисправимых ошибок секторов на диске, при их выявлении особого повода для паники быть не должно. Вот только тут нужно делать разницу между нестабильными секторами и якобы неустранимыми ошибками.

Значения показателей С5 и С6 в программе CrystalDiskInfo

Как уже было сказано, в вышеуказанном приложении вторым соответствует параметр «С6». А вот первые помечаются как «С5». Если происходит увеличение только второго значения с возрастанием количества, не факт, что винчестер начал «сыпаться». В случае же увеличения значения параметра «С6» или обоих одновременно необходимо срочно принимать меры и для начала попытаться хотя бы создать резервные копии нужных файлов или, если это возможно, скопировать их на съемный носитель.

Кроме того, стоит обратить внимание и на тот факт, что многие производители жестких дисков во избежание появления таких ситуаций заранее создают на винчестерах специальные резервные области. При выявлении неисправимых ошибок секторов на жестком диске лечение состоит в том, чтобы переназначить адрес сбойной ячейки памяти, присвоив ей одно из зарезервированных значений.

Симптомы проявления ошибок HDD

Но далеко не все пользователи следят за состоянием жесткого диска и регулярно его проверяют на ошибки. В большинстве случаев активные действия предпринимаются уже в самых чрезвычайных ситуациях. Поэтому изначально следует обращать внимание на работу HDD. Но как выявить, что на диске могут присутствовать ошибки и сбои?

Синий экран смерти при повреждении жесткого диска

Чаще всего определить наличие неисправностей можно по постоянному подвисанию операционной системы или снижению производительности, по появлению частых самопроизвольных перезагрузок и появлению синих экранов смерти, по невозможности загрузки при включении или рестарте компьютера и т. д.

Простейшая проверка неактивного логического раздела

Теперь остановимся на основных методах устранения возникших проблем. Самым примитивным решением является проверка на нестабильные сектора и неисправимые ошибки секторов применительно к логическим разделам, поскольку они не являются виртуальными, а создаются на основном носителе (только в другой области диска).

Простая проверка логического раздела

Для этого можно воспользоваться стандартной проверкой диска, вызываемой из раздела свойств в «Проводнике». В седьмой версии Windows и ниже указывать автоматическое исправление сбойных секторов или проведение теста поверхности нужно вручную. В версиях выше это не требуется.

Как проверить системный раздел?

Что касается системного раздела, тут не все так просто. Выявить неисправимые ошибки секторов вышеуказанным методом не получится (система просто выдаст уведомление о том, что проверка в данный момент активного тома невозможна). Однако в качестве дополнительного уведомления может выдаваться предложение о проведении проверки при следующем включении компьютера. С этим желательно согласиться и выполнить перезагрузку. При рестарте тестирование будет активировано без участия пользователя. Но и без перезагрузки выполнить проверку тоже можно.

Проверка системного раздела в командной строке

Для этого потребуется вызвать командную строку (обязательно от имени администратора) и задать в ней команду chkdsk /x/f/r, в которой атрибут «/x» отвечает за предварительное отключение активного тома, а два другие предназначены для поиска и устранения критичных ошибок и сбоев с восстановлением поврежденных секторов. Опять же, если проверка окажется невозможной, и будет предложено выполнить ее при рестарте, следует согласиться.

Как исправить неисправимые ошибки секторов в программе Victoria HDD?

Однако собственные средства системы, как небезосновательно считается, далеки от совершенства, поэтому для получения наиболее эффективного результата следует использовать сторонние программные продукты, среди которых лидером (это признано всеми экспертами) является приложение Victoria HDD, способное работать и из-под Windows, и в DOS-режиме, который является более предпочтительным.

Тестирование жесткого диска в программе Victoria HDD

В самой утилите поиск неисправимых ошибок секторов, равно как и нестабильных областей, основан на проведении четырех тестов:

  • Ignore (предварительная проверка на наличие сбойных или игнорируемых при чтении секторов);
  • Remap (переназначение адресов для выявленных ячеек);
  • Erase (стирание сбойных адресов поврежденных секторов или обнуление);
  • Restore (восстановление).

Примечание: тест с обнулением следует использовать только в самых крайних случаях, поскольку дальнейшая запись данных в такие секторы впоследствии окажется невозможной.

Утилита LifeGuard Diagnostic

Само собой разумеется, что можно использовать и другие программные продукты вроде Ashampoo HDD Control, HDDScan, Data LifeGuard Diagnostic и другие. Но первая приведенная выше программа, безусловно, является наилучшей (это не обсуждается).

Восстановление винчестера: возможно ли это?

Наконец, совершенно естественными выглядят вопросы, связанные с восстановлением жесткого диска, но не при помощи физического ремонта, а программными методами. До недавнего времени таковых не существовало. Однако с появлением небольшой программы под названием HDD Regenerator все изменилось.

Программа HDD Regenerator

Как считается, именно эта утилита способна производить так называемое перемагничивание поверхности жесткого диска, что позволяет восстановить не только работоспособность HDD, но и всю хранящуюся на нем информацию. Конечно, скептики в отношении ее использования приводят множество контраргументов, тем не менее многим это не мешает ее применять и, надо сказать, весьма небезуспешно. Работает приложение исключительно в DOS-режиме и имеет только англоязычный интерфейс (это два главных минуса программы). С другой стороны, в среде Windows запускать проверку жесткого диска, в общем-то, не рекомендуется вообще, а с другой – даже при минимальном знании английского языка особого труда разобраться с утилитой не составит (тем более что в основном все операции максимально автоматизированы).

Низкоуровневое форматирование жесткого диска

Наконец, если вообще ничего не помогает, можно попытаться произвести низкоуровневое форматирование при помощи программы HDD Low Level Format, но это уничтожит абсолютно все данные, а операционную систему придется устанавливать заново, хотя, если винчестер действительно начал «сыпаться», особого смысла в этом нет.

Что в итоге?

Как можно сделать вывод из всего вышесказанного, даже повреждение поверхности особой проблемой и не является, поскольку современные компьютерные технологии достигли того уровня, что восстановление жесткого диска производится совершенно элементарно. Что же касается предпочитаемых инструментов, конечно, лучше всего отдать предпочтение программе Victoria HDD (при наличии программных сбоев). Если ее применение результата при нерабочем жестком диске результата не даст, тогда уж ничего кроме приложения HDD Regenerator не поможет (и то, смотря, насколько серьезными окажутся выявленные проблемы).

22 февраля 2021 г.

Когда вы пытаетесь привести аргумент, важно, чтобы ваша логика имела смысл. Если вы сделаете логическую ошибку, это может подорвать вашу аргументацию и оставить вам мало что еще, чтобы поддержать ваше утверждение. В вашей карьере будут моменты, когда вам может понадобиться привести аргумент, поэтому важно понимать логические ошибки. В этой статье мы определяем, что такое логическая ошибка, и приводим 15 распространенных примеров.

Что такое логическая ошибка?

Логическая ошибка — это ошибка в рассуждениях, которая может сделать ваш аргумент недействительным. Не каждая логическая ошибка звучит одинаково. В то время как некоторые из них имеют очевидные несоответствия, другие достаточно тонкие, чтобы остаться незамеченными. Понимание распространенных логических ошибок является важной частью оценки чужих аргументов и создания собственных. Когда вы используете последовательную и осмысленную логику, ваш работодатель и коллеги с большей вероятностью воспримут ваши аргументы всерьез.

Примеры логических ошибок

Вот распространенные логические ошибки, с которыми вы можете столкнуться во время спора или дебатов:

Ошибка корреляции/причинности

Это заблуждение, когда люди считают, что корреляция равна причинно-следственной связи. Часто корреляции происходят по совпадению или из-за внешних сил. Они не обязательно означают, что одна вещь напрямую вызывает другую. Хотя этот аргумент может показаться простым в теории, его может быть сложно определить в действительности.

Пример: «На прошлой неделе наш веб-сайт получил много нового трафика. Мы также изменили шрифт на нашем веб-сайте на прошлой неделе. Это наводит меня на мысль, что благодаря нашему новому шрифту мы получили больше просмотров веб-сайта».

Заблуждение о подножке

Это заблуждение основано на идее, что если многие люди согласны в одном и том же вопросе, это должно быть правдой. Проблема с такого рода аргументами заключается в том, что только потому, что идея популярна, она не является автоматически правильной или истинной. Когда люди используют такого рода аргументы, это может привести к серьезным проблемам для компании. Сделав шаг назад, чтобы посмотреть, как обстоят дела на самом деле, вы можете внести значимые изменения на своем рабочем месте. Вера в такого рода заблуждения может сделать вас восприимчивым к давлению сверстников.

Пример: «Все довольны политикой нашей компании. Это означает, что нет необходимости получать обратную связь от наших новых сотрудников».

Ошибка анекдотических доказательств

Вместо того, чтобы использовать неопровержимые факты и данные, люди, использующие ошибку анекдотических свидетельств, основывают свои аргументы на собственном опыте. Такого рода аргументы сосредоточены на эмоциях, а не на логике. Они не признают, что опыт одного человека может не предоставить достаточных доказательств, чтобы сделать обобщенное утверждение. Хотя что-то может быть правдой для этого одного человека, это может не относиться к населению в целом.

Пример: «Всякий раз, когда я использую нашу систему электронной почты, у меня всегда возникают сбои. Я думаю, что нам нужно заменить всю систему для компании».

Заблуждение о соломенном человечке

Заблуждение соломенного чучела получило свое название, потому что это слабый аргумент, не имеющий смысла. Это происходит, когда ваш оппонент возражает против позиции, которую вы даже не пытаетесь изложить. С помощью этой тактики они склонны искажать или изменять то, что вы делаете. Вместо того, чтобы обсуждать ваш фактический аргумент, они нападают на более слабую или совершенно неверную версию того, что вы на самом деле имели в виду.

Пример:

Человек А: «Я думаю, что Джордж — талантливый копирайтер, и его нужно продвигать».

Человек Б: «Так вы говорите, что все остальные наши копирайтеры бездарны? Такое отношение вредит нашей команде».

Заблуждение о ложной дилемме

Это заблуждение утверждает, что вы можете разбить все аргументы на два противоположных мнения. Реальность такова, что у большинства субъектов есть спектр взглядов и мнений. Вместо того, чтобы предполагать, что проблема четко очерчена между двумя аргументами, они, как правило, более подвижны и детализированы. Главный недостаток такого заблуждения заключается в том, что оно заставляет другую сторону выглядеть неразумной. Вместо того, чтобы идти на компромисс, те, кто использует такого рода аргументы, пытаются выставить своего оппонента более радикальным.

Пример: «Если наш конкурент верит в это дело, то оно должно быть неправильным. Мы должны избегать поддержки этого дела, поскольку их идеалы так отличаются от наших».

Заблуждение ленивой индукции

Люди используют ошибку ленивой индукции, когда игнорируют существенные доказательства и делают свои утверждения, основанные на совпадении или чем-то совершенно не относящемся к делу. Для такого рода аргументов есть исследования или доказательства, которые ясно указывают на то, что что-то верно. Человек, выдвигающий свой аргумент, может выбрать или не признать это.

Пример:

Человек А: «Я был рад видеть, что наш процесс адаптации повысил уровень удержания наших сотрудников. Когда я брал интервью у наших сотрудников на прошлой неделе, 98% из них сказали, что они все еще работают в компании благодаря поддержке, которую они получили, когда начинали».

Человек B: «Я думаю, настоящая причина, по которой всем здесь нравится, заключается в том, что мы разрешаем собак в офисе».

Ошибка поспешных обобщений

Когда кто-то приходит к выводу, основанному на слабых доказательствах, он использует ошибку поспешных обобщений. Те, кто использует этот аргумент, не могут использовать хорошо изученные и проверенные доказательства для своих утверждений. Вместо этого они могут выбрать несколько ключевых деталей, которые соответствуют их положению. В то время как одно доказательство может подтвердить их аргумент, они не рассматривают контраргументы или другие типы доказательств, которые могут сделать их заявления недействительными.

Пример: «Сидней многому научился во время нашего последнего ретрита компании. Нам нужно потратить большую часть нашего бюджета, отправляя всю нашу компанию на ежегодные ретриты, чтобы мы все могли учиться».

Заблуждение среднего уровня

Те, кто использует такого рода аргументы, считают, что поиск компромисса между двумя противоположными точками должен быть правильным решением. Чего они могут не осознавать, так это того, что могут быть лучшие решения, совершенно не связанные с этими двумя противоположными аргументами. На самом деле эти аргументы могут быть совершенно несостоятельными, что означает, что поиск золотой середины не обязательно будет правильным решением.

Пример: «Я думаю, что наш работодатель должен повысить нам зарплату, а Дженни считает, что она должна остаться прежней. В качестве компромисса наш работодатель дает нам небольшую премию в конце года».

Бремя доказательства заблуждения

Ошибочность бремени доказательства — это когда вы предполагаете, что что-то истинно только потому, что против этого нет доказательств. Те, кто использует этот аргумент, утверждают, что их идеи и мнения правильны, потому что они не могут найти никаких других источников, противоречащих тому, что они говорят.

Пример: «Всем нравится наша маркетинговая кампания, потому что я не слышал, чтобы кто-то говорил иначе».

Ошибка не истинного шотландца

Это заблуждение возникает, когда один человек защищает свое обобщенное утверждение, отрицая контрпримеры. Они делают это, изменяя исходные условия своего обобщения, чтобы сделать недействительными любые контрпримеры, которые могут существовать.

Пример:

Человек А: «Каждый писатель любит использовать оксфордскую запятую».

Человек B: «Ну, на самом деле, многие писатели, которые следуют стилю AP, не используют оксфордскую запятую».

Человек А: «Тогда писатели, использующие стиль АР, не должны быть настоящими писателями».

Заблуждение техасского снайпера

Это заблуждение получило свое название от истории, в которой мужчина стреляет из пистолета в стену, а затем рисует мишень вокруг пулевых отверстий. Затем он показывает людям цель, чтобы доказать, что у него отличная цель. По сути, это заблуждение состоит в том, что вы выбираете конкретные доказательства или данные, которые соответствуют вашему утверждению, игнорируя при этом остальную имеющуюся у вас информацию. Исследователям часто нужно быть осторожными, выбирая только те наборы данных, которые поддерживают их гипотезу, когда они должны смотреть на все, что они собрали.

Пример: «Джереми утверждает, что он успешный бизнесмен, потому что в этом месяце у него появилось пять новых клиентов. Он не упоминает, что его продажи в этом году упали на 50%».

Заблуждение о ты-куоке

Вместо того, чтобы придумать веский контраргумент, те, кто использует ошибку tu quoque, обесценивают критические замечания своих оппонентов, обращаясь к ним с другой критикой. С помощью такого рода аргументов вы находите способ атаковать своего оппонента вместо того, чтобы придумывать логическую причину, чтобы возразить против его первоначального утверждения.

Пример:

Человек А: «Я думаю, вам нужно больше опыта управления проектами, прежде чем вы сможете претендовать на это повышение».

Человек Б: «У вас даже нет опыта управления проектами, так кто вы такой, чтобы делать такие заявления?»

Заблуждение личного недоверия

Когда людям сложно понять, почему или как что-то является правдой, они могут использовать этот аргумент, чтобы заявить, что это ложно. Даже если большая группа людей согласится с тем, что им трудно поверить в то, что что-то верно, это не означает автоматически, что это ложь. Это может просто означать, что им нужно больше контекста или информации, чтобы полностью понять утверждение.

Пример: «Я не понимаю, какую пользу нашему бренду приносит участие в социальных сетях, поэтому я сосредоточусь только на традиционных формах маркетинга».

Ошибка апелляции к авторитету

Когда люди злоупотребляют властью, может возникнуть такая ошибка. Те, кто используют это заблуждение, часто слишком доверяют мнению или мыслям одного человека. Это особенно заметно, когда этот человек спорит о чем-то, что выходит за рамки его компетенции. Хотя просьба авторитетного лица поддержать ваш аргумент может быть хорошей тактикой дебатов, это также может ввести в заблуждение, если вы сделаете это неправильно. Хотя это может быть частью ваших дебатов, вы также должны использовать факты и цифры, основанные на исследованиях, чтобы доказать свою точку зрения.

Пример: «Наш генеральный директор говорит, что нам не нужно беспокоиться об изменении климата, поэтому мне больше не нужно искать способы сделать нашу компанию более устойчивой».

Заблуждение

Хотя логические ошибки могут подорвать ваши аргументы, они не обязательно делают ваши утверждения неверными. Заблуждение — это когда кто-то замечает, что ваш аргумент содержит ошибку, которая заставляет его поверить, что все ваше утверждение ложно. Даже если у кого-то слабый аргумент, вы все равно можете обнаружить, что его точка зрения верна.

В приведенном ниже примере первый человек использует ошибку, чтобы показать, что собаки — хорошие компаньоны. Второй человек использует ошибку, чтобы доказать свою неправоту. Третий человек объясняет, что хотя первый человек использует заблуждение в поддержку своего утверждения, на самом деле есть доказательства того, что собаки могут быть хорошими компаньонами.

Пример:

Человек А: «Собаки — отличные компаньоны, потому что я их люблю».

Человек B: «Ну, мне ясно, что вы используете анекдотическое заблуждение, чтобы доказать свою точку зрения. Из-за этого мне трудно поверить, что собаки могут быть хорошими домашними животными».

Человек C: «Хотя они используют это заблуждение, существует множество веских доказательств того, что они — хорошие компаньоны».

Чрезвычайно благодарен авторам вот этих работ:

http://rlab.ru/doc/diagnostics_methods.html

http://www.mhdd.ru/how.shtml

http://onehalf.pisem.net/stat/badblocks1.html

http://hdd.kulichki.com/page.php?id=25

ru.wikipedia.org

Отдельное спасибо Сергею Немову.


Накопи́тель на жёстких магни́тных ди́сках, НЖМД, жёсткий диск, винт, хард, харддиск, HDD, HMDD или винче́стер, (англ. Hard (Magnetic) Disk Drive, HDD, HMDD) — энергонезависимое, перезаписываемое компьютерное запоминающее устройство. Является основным накопителем данных практически во всех современных компьютерах.

В отличие от «гибкого» диска (дискеты), информация в НЖМД записывается на жёсткие (алюминиевые или стеклянные) пластины, покрытые слоем ферромагнитного материала. В некоторых НЖМД используется одна пластина, в других — несколько на одной оси. Считывающие головки в рабочем режиме не касаются поверхности пластин благодаря прослойке набегающего потока воздуха, образуемого у поверхности при быстром вращении. Расстояние между головкой и диском составляет несколько нанометров (в современных дисках 5-10 нм), а отсутствие механического контакта обеспечивает долгий срок службы устройства. При отсутствии вращения дисков, головки находятся у шпинделя или за пределами диска в безопасной зоне, где исключён их нештатный контакт с поверхностью дисков.

По одной из версий название «винчестер» накопитель получил благодаря фирме IBM, которая в 1973 году выпустила жёсткий диск модели 3340, впервые объединивший в одном неразъёмном корпусе пластины диска и считывающие головки. При его разработке инженеры использовали краткое внутреннее название «30-30», что означало два модуля (в максимальной компоновке) по 30 Мб каждый. Кеннет Хотон, руководитель проекта, по созвучию с обозначением популярного охотничьего ружья «Winchester 30-30» предложил назвать этот диск «винчестером».

В Европе и США название «винчестер» вышло из употребления в 1990-х годах, в русском же языке сохранилось и получило полуофициальный статус, а в компьютерном сленге сократилось до слов «винт» (наиболее употребимый вариант), «винч» и «веник».

Физические дефекты

Дефекты поверхности.
Возникают при механическом повреждении магнитного покрытия внутри
пространства сектора, например из-за царапин, вызванных пылью,
старением блинов или небрежным обращением с винтом. Такой сектор должен
быть помечен как негодный и исключен из обращения.


Серво-ошибки.
У всех современных накопителей для перемещение головок используется
система, получившая название «voice coil» (звуковая катушка), которая в
отличие от шагового двигателя старых винтов, не имеет какой-либо
дискретности перемещения. Для точного попадания головок на дорожки в
винтах используется система с обратной связью, которая ориентируются по
специальным магнитным сервометкам, нанесенным на диск.
Сервометки имеются на каждой стороне каждого диска. Они расположены
равномерно вдоль всех дорожек, и строго радиально, как спицы в колесе,
образуя сервоформат. Он не относится к формату нижнего
уровня и на рисунке не показан, но имеется абсолютно у всех современных
винчестеров, и играет важнейшую роль. По сервометкам происходит
стабилизация скорости вращения двигателя и удержание головки на
заданном треке, независимо от внешних воздействий и тепловой деформации
элементов.

Однако в процессе эксплуатации винта, некоторые
сервометки могут оказаться разрушены. Если дохлых сервометок станет
слишком много, в этом месте начнут происходить сбои при обращении к
информационной дорожке: головка, вместо того, чтобы занять нужное ей
положение и прочитать данные, начнет шарахаться из стороны в сторону.
Это будет выглядеть как жирный и особо наглый BAD, или даже как группа
BAD’ов. Их присутствие часто сопровождается стуком головок, зависанием
накопителя и невозможностью исправить его обычными утилитами.
Устранение таких дефектов возможно только специальными программами,
путем отключения дефектных дорожек, а иногда и всей дисковой
поверхности. Для этих целей в некоторых накопителях имеется
серводефект-лист, хранящий информацию о плохих сервометках. В отличие
от P- и G-листа, серводефект-лист используется не транслятором, а всей
микропрограммой винта. К секторам, имеющим дефектные сервометки,
блокируется доступ даже по физическим параметрам, что позволяет
избежать стуков и срывов при обращении к ним. Самостоятельно винт
восстановить сервоформат не может, это делается только на заводе.

Аппаратные BAD’ы.
Возникают из-за неисправности механики или электроники накопителя. К
таким неполадкам относятся: обрыв головок, смещение дисков или погнутый
вал в результате удара, запыление гермозоны, а также различные глюки в
работе электроники. Ошибки такого типа обычно имеют катастрофический
характер и не подлежат исправлению программным путем.

Логические дефекты

Эти ошибки возникают не из-за повреждения поверхности, а из-за
нарушений логики работы сектора. Их можно разделить на исправимые и
неисправимые. Логические дефекты имеют такие же внешние проявления, как
и физические, и отличить их можно только косвенно, по результатам
различных тестов.

Исправимые логические дефекты (софт-бэды):
появляются, если контрольная сумма сектора не совпадает с контрольной
суммой записанных в него данных. Например из-за помех или отключения
питания во время записи, когда винт уже записал в сектор данные, а
контрольную сумму записать не успел. При последующем чтении
такого «недописанного» сектора произойдет сбой: винт сначала прочитает
поле данных, потом вычислит их контрольную сумму и сравнит полученное с
записанным. Если они не совпадут, контроллер накопителя решит, что
произошла ошибка и сделает несколько попыток перечитать сектор. Если и
это не поможет (а оно не поможет, так как контрольная сумма заведомо
неверна), то он, используя избыточность кода, попытается
скорректировать ошибку, и если это не получится — винт выдаст ошибку
внешнему устройству. Со стороны операционной системы это будет
выглядеть как BAD. Некоторые винты имели повышенную склонность к
образованию софт-бэдов из-за ошибок в микропрограмме — при определенных
условиях контрольные суммы вычислялись неправильно; у других это
происходило из-за дефектов механики. Например, у IBM DTLA периодически
нарушался контакт между платой и гермоблоком, что приводило к
пропаданию питания гермоблока в самое неподходящее время, в том числе и
при записи.

Операционная система или BIOS не могут исправить
логический дефект самостоятельно, так как прежде чем писать в сектор,
они проверяют его на целостность, нарываются на ошибку и отказываются
писать. При этом контроллер винта эту ошибку скорректировать тоже не
может: он тщетно пытается прочитать этот сектор со второй, с третьей
попытки, и когда это не получается — он всеми силами пытается себе
помочь, на ходу подстраивая канал чтения и сервосистему. При этом и
раздается тот самый душераздирающий скрежет, так хорошо знакомый
владельцам бэдастых «дятлов». Этот скрип производят не «головки по
поверхности», как многие привыкли думать, а всего лишь катушка
позиционера, из-за специфической формы тока, протекающего через нее, и
он абсолютно безопасен. Адрес непрочитанного сектора попадает во
временный дефект-лист, изменяя значение атрибута Current Pending Sector
в SMART, и сохраняется в нем. Ремапа при чтении не происходит.

И только принудительная низкоуровневая перезапись
этого сектора специальной программой в обход BIOS приводит к
автоматическому перерасчету и перезаписи контрольной суммы, т.е. бэд
бесследно исчезает. Переписать его можно дисковым редактором, способным
работать с винтом непосредственно через порты, но обычно «переписывают»
весь диск, заполняя его секторы нулями. Утилиты, делающие это, свободно
распространяются производителями хардов, и часто неправильно называются
«программами для низкоуровневого форматирования». На самом деле это —
простые «обнулители», что нисколько не мешает им избавлять винт от
бэдов: при удачной записи софт-бэды исчезают, а при неудачной — бэд
считается физическим, и происходит авторемап.

Неисправимые логические ошибки.
Это ошибки внутреннего формата винчестера, приводящие к такому же
эффекту, как и дефекты поверхности. Возникают при разрушении заголовков
секторов, например из-за действия на винт сильного магнитного поля. Но
в отличие от физических дефектов, они поддаются исправлению программным
путем. А неисправимыми они названы только потому, что для их
исправления необходимо сделать «правильное» низкоуровневое
форматирование, что обычным пользователям затруднительно из-за
отсутствия специализированных утилит. Поэтому в быту такой сектор
отключается так же, как и физический — с помощью ремапа. В настоящее
время все большее количество винтов выпускается по технологии ID-less
(сектора без заголовков), поэтому скоро этот вид ошибок станет
неактуальным.

«Адаптивные» бэды. Несмотря на то,
что винты является очень точными устройствами, при их массовом
производстве неизбежно возникает разброс параметров механики,
радиодеталей, магнитных покрытий и головок. Старым накопителям это не
мешало, но у современных винтов с их огромной плотностью записи,
малейшие отклонения в размерах деталей или в амплитудах сигналов, могут
привести к ухудшению свойств изделия, появлению ошибок, вплоть до
полной потери его работоспособности. Поэтому все современные винты при
изготовлении проходят индивидуальную настройку, в процессе которой
подбираются такие параметры электрических сигналов, при которых
устройству работается лучше. Эта настройка осуществляется программой
ПЗУ при технологическом сканировании поверхности. При этом генерируются
так называемые адаптивы — переменные, в которых
содержится информация об особенностях конкретного гермоблока. Адаптивы
сохраняются на блинах в служебной зоне, а иногда во Flash-памяти на
плате контроллера.

Если в процессе эксплуатации винта адаптивы
окажутся разрушены (это может случиться в результате ошибок в самом
винте, статического электричества или из-за некачественного питания),
то последствия могут быть непредсказуемы: от банальной кучи бэдов до
полной неработоспособности девайса, с отказом выходить на готовность по
интерфейсу. «Адаптивные>» бэды отличаются от обычных тем, что они
«плавающие»: сегодня они есть, а завтра могут исчезнуть и появиться
совсем в другом месте. Ремапить такой винт бесполезно —
дефекты-призраки будут появляться снова и снова. И при этом дисковая
поверхность может быть в безупречном состоянии! Лечатся адаптивные бэды
прогоном selfscan’а — внутренней программы тестирования, аналогичной
той, что применяется на заводе при изготовлении винтов. При этом
создаются новые адаптивы, и винт возвращается к нормальному состоянию.
Это делается в условиях фирменных сервис-центров.

Разумеется, начинаем с внимательного осмотра внешнего вида. Настоятельно рекомендую вооружиться лупой. Внешний вид может очень много рассказать о винчестере. К примеру, многочисленные царапины на боковинах корпуса говорят о том, что жесткий диск часто снимался-ставился, причем неаккуратно и впопыхах. Разумеется, для проведения этих операций системник не вытаскивался на освещенное место и не клался на бок для комфортной работы, а делалось это всё под «компьютерным» столом в узкой, пыльной и темной «будке», где системник, как правило, помещается. Будет справедливым предположить, что многочисленные манипуляции по съёму-установке предпринимались для переноса винчестера по различного рода местам, поэтому нелишне будет исследовать накопитель на предмет следов от ударов о бетонный пол, асфальт и пр. Неудобные условия для монтажа, описанные выше, зачастую приводят не только к косметическим повреждениям на боковинах, но и к порезам как уплотнителя крышки гермоблока, так и наклейки на технологическом окне, что ведет к разгерметизации винчестера. Попавшие внутрь остатки уплотнителя вместе с клеем, а также пыль окружающей среды ведут к мучительному подыханию голов и запилам на магнитных дисках.

Изучив корпус, переходим к внимательному осмотру платы электроники. Для этого могут понадобиться различные специфические отвертки для снятия платы как то: TORX-9, TORX-5 и т. д., т. к. на некоторых винчестерах (WD, в последнее время Seagate), в том числе и ноутбучных, элементы на плате спрятаны внутрь, и рассмотреть их без снятия последней физически не представляется возможным.

В первую очередь нас интересуют следы прогаров, прострелов элементов на плате, снесенные элементы, о былом наличии которых можно судить по оставшимся ошметкам в местах пайки. Типичными местами пробоев являются защитные стабилитроны на Seagate, Samsung, в последнее время и WD с Hitachi. Далее идут так называемые «нулевки» или «фузы» (нулевые резисторы либо предохранители, горящие при пробое стабилитронов, дабы не насиловать коротким замыканием блок питания: Samsung, последние WD).  Затем представляют интерес драйвера двигателей и головок: настоящий рекордсмен здесь WD, реже Maxtor, Seagate.

Исследуем PATA интерфейс на наличие вдавленных пинов (вдавленный 21-й пин ведет к тормозам при операциях записи-чтения или к зависанию на POST на некоторых материнских платах), говорящих о многократных панических всовываниях и вытаскиваниях кабеля (та самая «пляска с бубном» — а вдруг запустится), заломанных пластмассовых отбортовок, вследствие резкого бокового перекоса при снятии кабеля. Встречались случаи с загнутым вниз либо вообще отломанным от платы PATA интерфейсом — здоровяков на Руси хватает. На WD, вследствие частых и хаотических дерганий нередко отрывают колодку питания от платы. Внимательно осматриваем место пайки на снятой плате под лупой на наличие трещин в припое. Хлипкий SATA интерфейс страдает обламыванием пластмассового основания группы контактов, как на шине данных, так и по питанию, вследствие резкого и сильного перекоса кабелей при их снятии.

В связи с отказом производителей от свинцовых припоев вылезла проблема окисления контактных площадок на платах электроники винчестеров. Проблема несколько преувеличенная, и при нормальных условиях эксплуатации не имеющая негативных последствий. Игольчатые либо пружинные контакты достаточно надежно накалывают контактные площадки и обеспечивают вполне приемлемое соединение. Но, как показала практика, при несоблюдении прежде всего температурного режима, процесс окисления принимает лавинообразный характер, особенно если ему сопутствует повышенная влажность. Попадались случаи, когда контактные площадки окислялись буквально до черноты. Это действительно вело к жутчайшим глюкам накопителя: хаотическим софтбэдам, проблемам с чтением-записью, вплоть до развала внутренней микропрограммы. Косвенно такое состояние платы может свидетельствовать о перегреве в процессе эксплуатации в дешевых невентилируемых системных блоках, либо в различного рода видеорекордерах.

В визуальную диагностику входит и проверка правильности установки перемычек. Самые распространенные ошибки: WD установлен «мастером» на контактах 5-6 ( ::I::  — винчестер не определяется, либо долго висит на POST) — перемычка должна быть снята либо установлена в «нейтраль» на контакты 4-6; Samsung установлен «слейвом» на контактах 5-6 ( :I:: — винчестер обрезается до 32 ГБ) — перемычка должна быть снята, либо установлена в «мастер» на контакты 7-8 ( I::: ). Ставшая уже классической багофича южных мостов VIA VT8237 (R, R Plus) с неопределением на них SATA-2 винчестеров лечится установкой перемычки в SATA-1 (WD, Seagate, Samsung), либо, при отсутствии перемычек, программной модификацией фирмваре (Hitachi, Samsung).

MHDD — это небольшая, но мощная бесплатная программа, которая предназначена для
работы с накопителями на самом низком уровне (насколько это возможно).
Первая версия была выпущена в 2000 году, Дмитрием Постриганём. Она была способна
произвести сканирование поверхности накопителя с интерфейсом IDE в режиме CHS. Моя главная цель —
разработать диагностическое ПО для накопителей, которому бы доверяли.
Сейчас MHDD — это значительно больше, чем диагностика. Вы можете делать всё что угодно
при помощи MHDD: диагностировать накопители, выполнять чтение/запись произвольных секторов,
управлять системой SMART, парольной системой, системой управления шумовыми характеристиками,
а также изменять размер накопителя.

Сканирование поверхности

Сканирование любого устройства возможно только если оно может быть определено командами
ID или EID (или по нажатию F2). 

Инициализировав выбранный накопитель нажатием F2 получаем исчерпывающую о нем информацию:
— название модели; логические геометрию диска (логическое число цилиндров/головок/секторов на дорожке);
— серийный номер; версию микрокода;
— число адресуемых через LBA блоков;
— поддерживаемые функции ATA и максимальный поддерживаемый режим; состояние SMART (включена ли);
— состояние системы защиты (включен/выключен аппаратный пароль);
— полный размер винчестера; результат прохождения основных тестов.

Часть этой информации отображается во второй сверху строке на экране и видна при работе.

Кроме того, о состоянии диска и его занятии в данный момент времени сигнализируют индикаторы в самой верхней строке.

Они несут следующую информацию:

BUSY — накопитель занят и на команды не реагирует;
WRFT — ошибка записи;
DREQ — накопитель жаждет обменяться данными с внешним миром;
ERR — в результате какой-либо операции возникла ошибка.

Когда загорается этот бит, обратите внимание на правую верхнюю часть экрана.
Там будет отображен тип последней ошибки: (действительно только при зажженной лампочке «ERR»):

AMNF — Adress Mark Not Found — Обращение к какому-то конкретному сектору не удалось.
Вероятной причиной является повреждение этого сектора, повреждение его полей идентификации (упоминание об этом есть здесь).
Но
сразу после включения накопителя, как раз наоборот, свидетельствует об
отсутствии проблем и сообщает об успешном выполнении внутренней
диагностики;
T0NF — Track 0 Not Found — не найден нулевой трек;
ABRT — Abort, команда отвергнута;
IDNF — Sector ID Not found;
UNCR — Uncorrectable Error — Ошибка не скорректированная кодом ECC.
Вероятно, в данном месте имеет место быть логический бэд-блок (говорилось об этом здесь).

Кроме этих в верху могут гореть еще два индикатора — PWD — сигнализирующая об установленном аппаратном пароле, и HPА — если размер накопителя был изменен с помощью команды HPA (для скрытия бэд-блоков в конце диска используется обычно).

Для того, чтобы выполнить сканирование, наберите
SCAN и нажмите ENTER, или используйте F4.
Вы увидите меню, где сможете изменить некоторые настройки. По умолчанию, начальный сектор
равен нулю (стартовый сектор). Конечный сектор равен максимально возможному (конец диска).
Все деструктивные по отношению к пользовательским данным функции (Remap, Erase Delays)
по умолчанию выключены.

Нажмите F4 снова для запуска сканирования. MHDD сканирует накопители блоками.
Для накопителей IDE/SATA один блок равен 255 секторам (130560 байт).

Как работает сканирование

    1. MHDD посылает команду VERIFY SECTORS с номером LBA (номер сектора) 
и номером секторов в качестве параметров
2. Накопитель поднимает флаг BUSY
3. MHDD запускает таймер
4. После того, как накопитель выполнил команду, он опускает флаг BUSY
5. MHDD вычисляет затраченное накопителем время и выводит соответствующий
блок на экран. Если встретилась ошибка (bad block), программа выводит
соответствующую букву, которая описывает ошибку.

MHDD повторяет шаги 1—5 до конечного сектора. Если вам нужен протокол сканирования
— вы всегда можете найти его в файле log/mhdd.log.

Если сканирование выявило ошибки, первое, что необходимо сделать — это скопировать
все данные с накопителя. Затем необходимо выполнить полное стирание поверхности при помощи команды
ERASE, которая стирает каждый сектор на вашем накопителе. Накопитель пересчитает поля ECC для
каждого сектора. Это помогает избавиться от так называемых «soft-bad» блоков.
Если стирание не помогло, запускайте сканирование с включенной опцией REMAP.

Если вы видите, что каждый блок содержит ошибку, не пытайтесь стирать накопитель либо
производить сканирование с включенной опцией REMAP. Скорее всего, у накопителя повреждена
служебная область, и это не может быть исправлено стандартными командами MHDD.


Просмотр атрибутов SMART

Вы можете набрать SMART ATT или нажать F8 для просмотра атрибутов.
Что они означают?

Пожалуй, самый главный атрибут для современного накопителя — это
«Reallocated Sectors Count» (значение Raw). Это значение сообщает, сколько на диске
переназначенных секторов. Нормальный накопитель имеет raw-значение, равное нулю. Если вы
видите значение более 50 — у накопителя проблемы. Это может означать брак блока питания,
вибрация, перегрев, или же просто бракованный накопитель.

Взгляните на атрибут 194 — температура. Хорошие значения лежат в промежутке между
20 и 40 градусами. Некоторые накопители не сообщают температуру.

Атрибут UDMA CRC error rate означает количество ошибок, которые возникают при передаче данных
по IDE/SATA кабелю. Нормальное raw-значение этого атрибута равняется нулю. Если вы видите
другое значение, вам нужно срочно заменить кабель. Также, разгон очень влияет на количество ошибок
такого типа.

Другие атрибуты, обычно, не так важны.


Стирание групп секторов или целого диска

Вы можете использовать команду ERASE. Если ваш накопитель был опознан в BIOS Setup (или же
при тесте POST), MHDD попытается использовать функции BIOS для стирания накопителя в режиме UDMA.
Если вы не хотите, чтобы MHDD пыталась использовать BIOS, используйте параметр /DISABLEBIOS.


Уменьшение объёма накопителя

Используйте команду HPA для ограничения объёма накопителя. Программа спросит новое количество
доступных секторов. Для того, чтобы снять установленные ограничения, используйте команду NHPA.
Производите цикл «выключение-включение» накопителя перед использованием команды NHPA.
В соответствии с ATA/ATAPI standard, вы можете изменять объём накопителя
только один раз за один цикл работы накопителя.


Управление парольной защитой

Используйте команду PWD для блокировки накопителя при помощи пользовательского (USER) пароля.
В соответствии с ATA/ATAPI standard, вам необходимо произвести выключение
и включение накопителя для того, чтобы изменения вступили в силу.

В MHDD есть две команды для разблокировки накопителей: UNLOCK и DISPWD.
UNLOCK производит разблокировку накопителя до первого выключения. Для того, чтобы отключить парольную
систему, вам необходимо использовать сначала команду UNLOCK, а замем команду DISPWD (пароль должен быть известен).

Мастер-пароль устанавливается производителем и может быть использован для разблокировки.


Чтение секторов в файл

Вы можете считать всего несколько секторов или целый диск в файл или в набор файлов.
Попробуйте команду TOF. Программа пропускает дефектные сектора. Если вы планируете
создавать образ размером более 1 гигабайт, лучше использовать команду ATOF, так как она умеет
автоматически «нарезать» образы.


Запись секторов из файла на диск

Используйте команду FF для записи секторов на диск. Вас попросят ввести номер первого сектора
для записи и количество записываемых подряд секторов.


Управление шумовыми характеристиками накопителя

Почти все современные накопители поддерживают Acoustic Management.
Вы можете уменьшить уровень шума, издаваемого при перемещении головок, путём уменьшения скорости
их перемещения. Используйте команду AAM для настройки.


Конфигурация накопителя

При помощи команды CONFIG вы можете просматривать и изменять конфигурацию накопителя, например,
максимальный режим UDMA, поддержка систем Security, SMART, AAM, HPA, поддержка режима LBA48.
Также возможно изменение размера диска. Некоторые производители

Другие команды

Нажмите F1. Вы увидите краткую справку по всем командам MHDD. Для получения более детальной
информации, пожалуйста, пользуйтесь командой MAN.

При изучении винчестера с периодически возникающими
проблемами, либо вообще с непонятной историей болезни, крайне важное
значение имеет изучение наихудших (worst) параметров, сигнализирующих о
том, насколько винчестеру было плохо в какой-то промежуток времени. Вот
интересный пример Samsung’а, с периодически вылетающей по прогреву на
записи 2-й головой. Обнаружить этот плавающий глюк помог нам анализ
худших параметров.

HDD: SAMSUNG HD401LJ; FW: ZZ100-15; SN: S0HVJ1WL901029
--------------------------------------------------------

         Name                       
Val Worst Raw
Att #   1 : Read error
rate           :
253   93  0 

Att #   3 : Spin up
time             
: 100  100  8064 
Att #   4 : Number of spin-up times   : 100 
100  32 
Att #   5 : Reallocated sectors count : 253  253 

Att #   7 : Seek error
rate           :
253  253  0 
Att #   8 : Seek time performance     :
253  253  0 
Att #   9 : Power-on
time            
: 253  253  4 
Att #  10 : Spin-up
retries           :
253  253  0 
Att #  11 : Calibration
retries       : 253  253 

Att #  12 : Start/stop
count          : 100 
100  31 
Att # 190 :
Unknown                  
:  63   62  37 
Att # 194 : HDA
Temperature          
: 127  124  37 
Att # 195 : Hardware ECC recovered    : 253 
100  159 
Att # 196 : Reallocate event count    : 253 
253  0 
Att # 197 : Current pending
sectors   : 253  
90  0 

Att # 198 : Offline scan UNC sectors  : 253  253 

Att # 199 : Ultra ATA CRC Error Rate  : 200  200 

Att # 200 : Write error
rate          :
253   90  0 

Att # 201 :
Unknown                  
: 253  100  0 
Att # 202 :
Unknown                  
: 253  253  0 

Интересны худшие значения Read error rate, Current
pending sectors и Write error rate. По прогреву пишущая головка
начинает глючить (Write error rate) и садить софт-бэды, которые и
отобразились в Write error rate и Current pending sectors. После
довольно продолжительного бездействия головка на время
восстанавливает  работоспособность и прекрасно убирает дефекты
записью, но с нагревом всё начинается
снова.

Или пример разгерметизированного WD. Целостность
уплотнителя была
восстановлена, но нормальной работы под нагрузкой, разумеется, достичь
не удалось.

HDD: WDC WD4000AAKS-00YGA0; FW: 12.01C02; SN: WD-WCAS86084683
--------------------------------------------------------

        
Name                       
Val Worst Raw
Att #   1 : Read error
rate           :
193    1  789 

Att #   3 : Spin up
time             
: 214  179  4291 

Att #   4 : Number of spin-up times   : 100 
100  29 
Att #   5 : Reallocated
sectors count : 200  195 

Att #   7 : Seek error
rate           :
199  197  52 

Att #   9 : Power-on
time            
: 100  100  26 
Att #  10 : Spin-up
retries           :
100  253  0 
Att #  11 : Calibration
retries       : 100  253 

Att #  12 : Start/stop
count          : 100 
100  23 
Att # 192 : Power-off retract count   : 199  199 
809 
Att # 193 : Load/unload cycle count   : 200  200 
818 
Att # 194 : HDA
Temperature          
: 128  101  22 
Att # 196 : Reallocate event count    : 200 
190  0 
Att # 197 : Current pending
sectors   : 200  198 

Att # 198 : Offline scan UNC sectors  : 200  200 

Att # 199 : Ultra ATA CRC Error Rate  : 200  200 

Att # 200 : Write error
rate          : 200 
200  0 

Worst Read error rate говорит нам, что винт одно
время пребывал просто в ауте, когда его дырявого пытались мучить. Плюс
к тому, подваленный worst Spin up time говорит об эксплуатации на плохом
блоке питания. Worst Reallocated sectors count поведал нам о том, что
бэды от разгерметизации наличествовали, но ушли после записи. Seek
error rate показал проблемы с позиционированием — грязные головы либо
плохо видят сервометки, либо некоторые сервометки повреждены. Worst
Current pending sectors зафиксировал бывшие в очереди дефекты, которые
убрались записью. В целом, текущее значение Read error rate означает,
что чтение не нормализовалось (что неудивительно на такой плотности) и
винт не жилец.

На закуску однозначный пример полудохлого
Quantum AS, совершенно непригодного к эксплуатации.

HDD: QUANTUM FIREBALLP AS20.5; FW: A1Y.4500; SN: 792125276721
--------------------------------------------------------

        
Name                       
Val Worst Raw
Att #   1 : Read error
rate           :
100  253  0 
Att #   3 : Spin up
time             
:  79   79  2663 
Att #   4 : Number of spin-up times   : 
97   97  2573 
Att #   5 : Reallocated
sectors count :  14  
14  431 

Att #   7 : Seek error
rate           :
100  100  0 
Att #   9 : Power-on
time            
:  86   86  9363 
Att #  10 : Spin-up
retries           :
100  100  0 
Att #  11 : Calibration
retries       : 100  100 

Att #  12 : Start/stop
count          : 
97   97  2559 
Att #  13 : Soft read error rate      :
100   70  0 
Att # 195 : Hardware ECC
recovered    :  
4    1  12822750 

Att # 196 : Reallocate event count    : 100 
253  0 
Att # 197 : Current pending
sectors   :  82  
81  94 

Att # 198 : Offline scan UNC sectors  : 100  253 

Att # 199 : Ultra ATA CRC Error Rate  : 200  200 

431 сремапленный сектор (Reallocated sectors count),
94 в очереди (Current pending sectors). А проблема в практически
нечитающих головах. Мусор, который поступает с них, контроллер
пока еще в состоянии исправить, но возможности его уже исчерпаны
(Hardware ECC recovered) — винчестер находится в коматозном состоянии.

В предыдущих статьях мы неоднократно упоминали о таком явлении, как сбойный (плохой или bad) блок, однако до сих пор не дали точного определения, что же это такое, каковы причины их возникновения, как с ними бороться и нужно ли. В этой статье рассмотрим два первых вопроса и предоставим вам немного времени для собственных размышлений и поисков решений. В следующий раз все-таки поговорим о методах борьбы с ними.

Итак, под bad-блоком понимается обычно конкретный участок диска, нормальная работа с которым не гарантируется или невозможна вовсе. На таких участках может содержаться различная информация, это могут быть данные пользователя или служебная информация (иначе называемая серво (очевидно от лат. servire или англ. serve — служить), в этом случае это чревато последствиями, тяжесть которых варьируется в очень широких пределах), хотя, конечно же, лучшим вариантом было бы отсутствие в этой области чего-либо (правда, столкнуться с бэдами в таких областях скорее не придется). Появление таких секторов может быть обусловлено разными причинами, в одном случае такие секторы можно восстановить, в другом нельзя, в одном нужно использовать одни методы лечения и переназначения в другом другие. Но сначала развеем несколько довольно распространенных мифов.

Миф первый: на современных винчестерах не бывает бэдов. Это неправда, бывают. По большому счету технология та же, что и годы назад, только усовершенствованная и доработанная, но по прежнему не идеальная (впрочем, идеальная вряд ли будет создана на базе технологий магнитной записи).

Миф второй: для винчестеров оснащенных SMART это не актуально (читай там не может быть бэдов). Тоже не так: актуальна, ничуть не меньше чем для винчестеров без SMART (если таковые еще остались). Понятие сбойного сектора для нее родное и близкое, это должно было стать понятно из соответствующих публикаций посвященных этой технологии (ссылки в конце). Дело только в том, что большую часть забот о таких секторах ранее возлагавшуюся на пользователя, SMART взяла на себя. И часто может случиться так, что пользователь вообще ничего не знает и не узнает о имеющих место бэдах на его винте, если конечно ситуация не патологическая. Доводилось слышать от пользователей, что так продавцы порой аргументируют свой отказ в гарантийном обмене винчестеров, у котрых бэды «всплыли» наружу. Продавец, конечно же, не прав. SMART не всемогуща, а бэды пока никто не отменял.

Для того, что бы разобраться в бэдах и их разновидностях, углубимся в метод хранения информации на винчестере, совсем на чуть-чуть. Выясним два момента.

1. Единицей которой оперирует винчестер на низком уровне является сектор. В физическом пространстве на диске, соответствующем сектору, записываются не только непосредственно данные, но и служебная информация — поля идентификации и контрольная сумма для него, данные и контрольный код для них, код для восстановления ошибок и др. (не стандартизировано и зависит от производителя и модели). По наличию полей идентификации различают два вида записи — с полями идентификаторов и без оных. Первый стар и уступил свои позиции в пользу последнего. Позже станет понятно, почему я это отмечаю. Важно также, что имеются средства контроля ошибок (которые как мы увидим, могут стать их источниками).

2. При работе со старыми винчестерами необходимо было прописать в BIOS их физические параметы, которые указывались на этикете, а для того, чтобы однозначно адресовать блок данных, необходимо было указывать номер цилиндра, номер сектора на дорожке, номер головки. Такая работа с диском была полностью зависимой от его физических параметров. Это не было удобным, и связывало руки разрабочикам во многих вопросах. Требовался выход и он был найден в трансляции адресов. Та, которая нас интересует — данные в накопителе решено было адресовывать одним параметром, а функцию определения действительного физического адреса соответствующего этому параметру возложить на контроллер жесткого диска. Это давало терубемую свободу и совместимость.

Реальные физические данные накопителя уже оказывались не важны. Важно только, чтобы число логических блоков указанное BIOS не превышало действительное. Создание такого транслятора имеет огромное значение и для вопросов бэд-секторов тоже. И вот почему. Обработка плохих секторов старых жестких дисках была не совершенна, осуществлялась средствами файловой системы. Диск поставлялся с наклейкой, на которой были указаны адреса дефектных блоков, найденных изготовителем. Пользователь сам в ручную заносил эти данные в FAT, и исключал таким образом исключалось обращение к ним операционной системы.

Технология изготовления пластин была несовершенная тогда, и несовершенна сейчас. Не существует методов создания идеальной поверхности не содержащей ни одного плохого блока, вопреки встречающемуся мнению, что с завода винчестер поставляется без них. С ростом объема дисков росло количество сбойных секторов при выходе с завода, и, понятно, что только до определенного момента процедура их регистрации в FAT могла выполнятся в ручную, нужно было найти способ маркировать бэды, даже не смотря на то, что не известно, какая файловая система будет использоваться. Изобретение транслятора позволило решить эти проблемы. На винчестере выделялась специальная защищенная область, куда записывался транслятор, в котором устанавливалось соответствие каждого логического блока непрерывной цепочки и реального физического адреса.

Если вдруг на поверхности обнаруживался сбойный блок, то он просто пропускался, а данному логическому блоку присваивался адрес следующего физического доступного блока. Транслятор считывался с диска при включении. Создание его выполнялось (и выполняется) на заводе, и именно по этому, а не от того, что производителем применяется какая-то супер технология, новые диски как бы не содержат бэд-блоков. Физические параметры оказались скрыты (и они слишком рознились, так как у фирм оказались развязаны руки в производстве своих собственных форматов низкого уровня, и пользователя это не заботило), дефекты помечались на заводе, универсальность увеличилась. Хорошо как в сказке.

Теперь вернемся к бэдам и их разновидностям. В зависимости от природы происхождения всех их можно подразделить на две большие группы: логические и физические.

Физические и логические дефекты

Дефекты поверхности могут быть связаны с постепенным износом магнитного покрытия дисков, просочившимся через фильтр мельчайшим частицам пыли, кинетическая энергия которых, разогнанных внутри накопителя до колоссальных скоростей, оказывается достаточной для повреждения поверхности дисков (впрочем, скорее всего они скатяться с диска под действием центробежных сил и будут задержаны внутренним фильтром, но напакостить могут успеть), результатом механических повреждений при ударе, при котором могут из поверхности могут выбиться маленькие частицы, которые потом в свою очередь также будут выбивать другие частички, и процесс пойдет лавинообразно (такие частицы тоже будут скатываться с пластин под действием центробежных сил, но значительно дольше и тяжелее, так как будут удерживаемы силами магнитного притяжения. Это еще чревато тем, что с ними будет происходить столкновение головки, парящей на очень малой высоте, что вызовет ее нагрев и ухудшение рабочих характеристик — будут возникать искажения сигнала, результат — ошибки чтения), доводилось слышать (у меня такой статистики нет) что и курение у компьютера способно сделать то же самое, так как табачные смолы способны проникать сквозь воздушный фильтр винчестера (у которых он есть), приводя там к прилипанию головок к пластинам (порче поверхности и головок), просто оседая на поверхности, и меняя тем самым рабочие характеристики и т.д.

Такие сектора к обращению оказываются непригодными и должны быть исключены из обращения. Восстановление их не представляется возможным ни в домашних условиях, ни в условиях сервисных центров. Будет хорошо, если из них удасться хотя бы восстановить информацию. Скорость процесса такого вида разрушения поверхности индивидуальная. Если число бэдов не растет или растет крайне незначительно, то можно серьезно не опасаться (хотя делать резервное копирование все же стоит) если же рост быстрый, то диск придется заменить, и, причем, очень поторопиться. При данном виде бэдов можно произвести переназначение блоков на резервную поверхность: имеет смысл при отсутствии прогрессирования. Но об этом не сейчас. Это если говорить об области данных.
Как уж было отмечено, на пластинах храниться еще и служебная информация. В процессе использования она также может оказаться разрушенной. Это может быть гораздо болезненнее, чем обычной пользовательской поверхности.

Дело в том, что сервоинформация активно используется в процессе работы: по серво меткам происходит стабилизация скорости вращения дисков, удержание головки над заданным цилиндром независимо от внешних воздействий. Незначительные разрушения сервоинформации могут пройти незамеченными. Серьезные повреждения сервоформата могут сделать недоступной какую-то часть диска или весь диск целиком. Поскольку сервоинформацей пользуется программа накопителя и она критически важна для обеспечения нормального функционирования и вообще в силу ее специфики, дела обстоят с ней намного сложнее. Некоторые винчестеры позволяют отключить сбоящие серводорожки. Восстановление же их возможно только на заводе на специальном дорогом и сложном оборудовании (оценим приблизительно расходы на такой ремонт негарантийного винчестера и поймем, что правильно будет назвать этот вид бэдов неисправимым).

К физическим бэдам можно также отнести сбойные сектора, появление которых обусловлено неисправностями электронной или механической части накопителя, например обрыв головок, серьезные механические повреждения в результате удара — заклинивание катушки позиционера или дисков, смещение дисков. Действия здесь могут быть различными и зависеть от конкретной ситуации, если, например, обрыв головки (такие бэды появляются потому, что делается попытка обращения к поверхности, доступ к которой не может быть осуществлен (что вовсе не означает, что что-то не так с поверхностью)), то, например, часто ее можно отключить (а можно и поменять в условиях специализированных сервисных центров, вот только стоиомость операции заставляет серьезно задуматся о ее целесообразности (в большинсте случаев ответ отрицательный), если конечно, речь не идет о необходимости восстановить крайне ценную информацию (но это уже другой разговор)).

В целом же для этого вида повреждений характерен катастрофический характер.
Т.е. как видим физические бэды не лечатся, возможно лишь какое-то «смягчение» их присутствия.
С логическими плохими секторами ситуация проще. Некоторые из них излечимы. В большинстве случаев обусловлены ошибками записи. Можно выделить следующие категории:

1. Самый простой случай: ошибки файловой системы. Сектор помечен в FAT как сбойный, но на самом деле таковым не является. Раньше таким приемом пользовались некторые вирусы, когда на небольшом обьеме винчестера требовалось найти себе укромное местечко, не доступное простыми средствами. Сейчас этот прием не актуален, так как скрыть в недрах Windows пару мегабайт (а то и пару десятков мегабайт) не представляет никакой сложности. Кроме того так кто-то мог просто пошутить над незадачливым пользователем (программы попадались такие). Да и вообще файловая система вещь хрупкая, лечится очень легко и абсолютно без последствий.

2. Неисправимые логические бэды — характерны для старых винчестеров использующих запись с полями идентификаторов. Если у вас такой диск, то вполне можете с ними столкнуться. Обусловлено неверным форматом физического адреса, записанного для данного сектора, ошибка контрольной суммы для него и т.д. Соответственно, невозможно обращением к нему. На самом деле они восстановимы, но на заводе. Поскольку я уже сказал, что сейчас используется технология записи без полей идентификаторов, то эту разновидность можно считать неактуальной.

3. Исправимые логические бэды. Не так уж редко встречаемый, особенно на некоторых типах накопителей тип сбойных блоков. Происхождением в основном обязаны ошибкам записи на диск. Чтение произвести с такого сектора не удается, так как обычно в нем ЕСС код не соответствует данным, а запись обычно невозможна, так как перед записью осуществляется предварительная проверка подлежащего записи пространства, и поскольку с ней уже обнаружены проблемы, запись в данную область отклоняется. Т.е. получается блок невозможно использовать, хотя физически поверхность, им занимаемая в полном порядке. Дефекты подобного рода могут быть иногда вызваны ошибками в микропрограмме винчестера, могут быть спровоцированы программным обеспечением или техническими причинами (напримем перебоем питания и его колебанием, уходом во время записи головки на недопустимую высоту и др.). Но если удается привести в соответствие содержимое сектора и его ECC-код, то такие блоки бесследно проходят. Причем процедура эта не сложна, а средства для ее осуществления широко доступны, и, в общем-то, безобидны.

4. Появления на винчестерах бэд-блоков этого вида обязано особенностям технологии производства: никогда не существует двух абсолютно одинаковых устройств, какие-то их параметры непременно отличатся. При подготовке винчестеров на заводе, для каждого определяется набор параметров, обеспечивающих наилучшее функционирование данного конкретного экземпляра, так называемые адаптивы. Эти параметры сохраняются, и в случае если они каким то загадочным образом оказываются повреждены, то результатом может быть полная неработоспособность диска, нестабильная его работа или большое количество сбойных секторов появляющихся и исчезающих то в одном, то в другом месте. В домашних условиях с этим сделать ничего нельзя, но все можно настроить на заводе или в сервисном центре.

Как видим, реально лечатся в домашних условиях только два вида логических бэдблоков. Другие в случае необходимости можно попробовать подменить на резервные, но не вылечить. С третьими дома сделать ничего нельзя. О том, как и что нужно делать в первых двух случаях будем говорить в следующий раз.

Продолжение следует

Дополнительные материалы:

Критерии отбора HDD
SMART — технология внутренней оценки состояния HDD
SMART технологии: Data Lifeguard, MaxSafe, Drive Fitness Teсhnologies, Data Protection System

Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.

Техническое обслуживание средств вычислительной техники Учебно-методическое пособие

3.1.6. Особенности конструкции современных НЖМД, виды дефектов магнитного диска НЖМД

Современный накопитель на жестких магнитных дисках (НЖМД) представляет собой сложное электронно-механическое устройство. Элементы накопителя размещены на электронной плате и гермоблоке (см. Рисунок36). Основным элементом, размещенным на электронной плате является микроконтроллер (специализированная микроЭВМ), который управляет работой всех устройств накопителя и организует связь с ЦП. Все данные подлежащие хранению размещаются на магнитном диске, который имеет следующую логическую организацию (см. рис 37 ):

Рисунок 37 – Структурная схема НЖМД

Рисунок 38 – Схема размещения данных на диске

Служебная информация

Служебная информация необходима для функционирования самого НЖМД и скрыта от пользователя. Служебную информацию можно разделить на четыре основных типа:

серво-информацию, или серворазметку;

формат нижнего уровня;

91

Техническое обслуживание средств вычислительной техники Учебно-методическое пособие

резидентные микропрограммы (рабочие программы);

таблицы конфигурации и настройки

таблицы дефектов.

Серворазметка необходима для работы сервосистемы привода магнитных

головок НЖМД. Именно по серворазметке осуществляется их позиционирование и удержание на дорожке. Сервисная разметка записывается на диск в процессе производства через специальные технологические окна в корпусе собранного гермоблока. Запись осуществляется собственными головками накопителя при помощи специального высокоточного прибора — серворайтера. Перемещение позиционера головок осуществляется специальным толкателем серворайтера по калиброванным шагам, которые намного меньше межтрековых интервалов.

Рабочие программы (микрокод) управляющего микроконтроллера представляют собой набор программ, необходимых для работы НЖМД. К ним относятся программы первоначальной диагностики, управления вращением двигателя, позиционирования головок, обмена информацией с дисковым контроллером, буферным ОЗУ и т.д.

Производители жестких дисков размещают часть микропрограмм на магнитном носителе не только для экономии объема ПЗУ, но и для возможной оперативной коррекции кода, если в процессе производства или эксплуатации обнаруживаются ошибки. Переписать микропрограмму на диске значительно проще, чем перепаивать «прошитые» микроконтроллеры.

Таблицы конфигурации и настройки накопителей содержат информацию о логической и физической организации дискового пространства. Они необходимы для самонастройки электронной части диска, которая одинакова для всех моделей семейства.

Таблицы дефектов. (дефект-лист) содержит информацию о выявленных дефектных секторах

Современные винчестеры имеют как правило два основных дефект-листа:

Первый P-list(«Primary»-первичный) заполняется на заводе при изготовлении накопителя;

Второй G-list («Grown» — растущий), и пополняется в процессе эксплуатации винта, при появлении новых дефектов.

Кроме того, некоторые НЖМД имеют еще

лист серво-дефектов (сервометки, наносимые на пластины винчестеров, тоже иногда имеют ошибки),

список временных (pending) дефектов. В него контроллер заносит

«подозрительные» с его точки зрения секторы, например те, что прочитались не с первого раза, или с ошибками.

Технология изготовления магнитных дисков очень сложная, контроль

состояния поверхности диска осуществляется на всех этапах изготовления, но даже это не позволяет получить поверхность магнитного диска без дефектов. В ходе эксплуатации диска количество дефектов возрастает. Поэтому производители накопителей предусмотрели специальные методы скрытия

92

Техническое обслуживание средств вычислительной техники Учебно-методическое пособие

дефектов, которые позволяют скрыть дефекты как при производстве так и при эксплуатации.

Методы скрытия дефектных секторов (при производстве дисков). В

наспоящее время припроизводстве дисков используется несколько основных методов скрытия дефектов.

Первый заключается в переназначении адреса испорченных секторов в на адрес резервного сектора (Рисунок 38).

Метод вызывает потерю производительности НЖМД, так как он, каждый раз обнаруживая сектор, помеченный как негодный, будет вынужден перемещать головки в резервную область, которая может находиться далеко от места дефекта.

Такой метод скрытия дефектов получил название «метод замещения» или ремап (от английского «re-map»: перестройка карты секторов). В настоящее время при производстве не применяется.

Рисунок 39 — Методы переназначения сектора

Второй (основной) способ использует следующий алгоритм: после выявления всех дефектов, адреса всех исправных секторов переписываются заново, так, чтобы их номера шли по порядку. Плохие сектора просто игнорируются и в дальнейшей работе не участвуют. Резервная область также остается непрерывной и ее часть присоединяется к концу рабочей области — для выравнивания объема. Этот, второй основной тип скрытия дефектов получил название «метод пропуска сектора». Новый диск не имеет Bad-секторов, а

резервная область непрерывна!

Рисунок 40 — Метод пропущенного сектора

Методы скрытия дефектных секторов при эксплуатации дисков Для скрытия дефектов в бытовых условиях применяется «метод

замещения» Ремап Замещение выполняется в автоматическом режиме эта технология получила

название automatic defect reassignment (автоматическое переназначение дефектов), а сам процесс — reassign.

Работает ремап следующим образом:

если при попытке обращения к сектору происходит ошибка, контроллер понимает, что данный сектор неисправен, и «на лету» помечает его как BAD.

Его адрес тут же заносится в таблицу дефектов (G-list).

93

Техническое обслуживание средств вычислительной техники Учебно-методическое пособие

Во время работы контроллер постоянно сравнивает текущие адреса секторов с адресами из таблицы и не обращается к дефектным секторам. Вместо этого он переводит головки в резервную область и читает сектор оттуда. На характеристике диска Vчтения=F(Nдор), как небольшие провалы на графике чтения. Тоже самое будет и при записи.

Система оперативного наблюдения за состоянием HDD — S.M.A.R.T.

Почти все винчестеры, выпущенные после 95-го года, имеют систему оперативного наблюдения за своим состоянием — S.M.A.R.T. (Self Monitoring And Reporting Technology).

Между атрибутами SMART и состоянием поверхности существует некоторая взаимосвязь. Некоторые имеют прямое отношение к bad-блокам:

Reallocated sector count и Reallocated event count: число переназначенных секторов. Эти атрибуты показывают количество секторов, переназначенных ремапом в G-list дефект-лист. У новых винтов они обязательно должны быть равны нулю! Если их значение отличается от нуля, то это означает, что винт уже был в употреблении.

Raw read error rate: количество ошибок чтения. Это «мягкие» ошибки, успешно скорректированные электроникой накопителя и не приводящие к искажению данных. Опасно, когда этот параметр резко снижается за короткий срок, переходя в желтую зону. Это говорит о серьезных проблемах в накопителе.

Current Pending Sector: этот атрибут отражает содержимое «временного» дефект-листа, присутствующего на всех современных накопителях, т.е. текущее количество нестабильных секторов. Эти секторы винт не смог прочесть с первого раза. Постоянное значение этого атрибута выше нуля говорит о неполадках в накопителе.

Uncorrectable Sector: показывает количество секторов, ошибки в которых не удалось скорректировать ECC-кодом. Если его значение выше нуля, это означает, что винту пора делать ремап.

Виды дефектов магнитного диска НЖМД

Дефекты поверхности НЖМД делятся на следующие группы:

1.Физические дефекты, которые подразделяются на: Дефекты поверхности.

Серво-ошибки Аппаратные BAD’ы.

2.Логические дефекты, которые подразделяются на: Исправимые логические дефекты (софт-бэды) Неисправимые логические ошибки.

«Адаптивные» бэды.

Дефекты поверхности. Возникают при механическом повреждении магнитного покрытия внутри пространства сектора, например из-за царапин, вызванных пылью, старением блинов или небрежным обращением с винтом. Такой сектор должен быть помечен как негодный и исключен из обращения.

94

Техническое обслуживание средств вычислительной техники Учебно-методическое пособие

Серво-ошибки. По сервометкам происходит стабилизация скорости вращения двигателя и удержание головки на заданном треке, независимо от внешних воздействий и тепловой деформации элементов.

Однако в процессе эксплуатации диска, некоторые сервометки могут оказаться разрушены. Если плохих сервометок станет слишком много, в этом месте начнут происходить сбои при обращении к информационной дорожке: головка, вместо того, чтобы занять нужное ей положение и прочитать данные, начнет шарахаться из стороны в сторону. Наличие таких ошибок часто сопровождается стуком головок, зависанием накопителя и невозможностью исправить его обычными утилитами. Устранение таких дефектов возможно только специальными программами, путем отключения дефектных дорожек, а иногда и всей дисковой поверхности.

Самостоятельно НDD восстановить сервоформат не может, это делается только на заводе.

Аппаратные BAD’ы. Возникают из-за неисправности механики или электроники накопителя. К таким неполадкам относятся:

обрыв головок;

смещение дисков;

погнутый вал в результате удара;

запыление гермозоны;

различные «глюки» в работе электроники.

Ошибки такого типа обычно имеют катастрофический характер и не подлежат исправлению программным путем.

Исправимые логические дефекты (софт-бэды): появляются, если контрольная сумма сектора не совпадает с контрольной суммой записанных в него данных.

Возникает из-за помех или отключения питания во время записи, когда HDD уже записал в сектор данные, а контрольную сумму записать не успел.

При последующем чтении такого «недописанного» сектора произойдет сбой: винт сначала прочитает поле данных, потом вычислит их контрольную сумму и сравнит полученное с записанным. Если они не совпадут, контроллер накопителя решит, что произошла ошибка и сделает несколько попыток перечитать сектор. Если и это не поможет (а оно не поможет, так как контрольная сумма заведомо неверна), то он, используя избыточность кода, попытается скорректировать ошибку, и если это не получится — винт выдаст ошибку внешнему устройству. Со стороны операционной системы это будет выглядеть как BAD.

Неисправимые логические ошибки. Это ошибки внутреннего формата винчестера, приводящие к такому же эффекту, как и дефекты поверхности. Возникают при разрушении заголовков секторов, например из-за действия на винт сильного магнитного поля. Но в отличие от физических дефектов, они поддаются исправлению программным путем. А неисправимыми они названы только потому, что для их исправления необходимо сделать «правильное»

95

Техническое обслуживание средств вычислительной техники Учебно-методическое пособие

низкоуровневое форматирование, что обычным пользователям затруднительно изза отсутствия специализированных утилит.

«Адаптивные» бэды. Несмотря на то, что винты является очень точными устройствами, при их массовом производстве неизбежно возникает разброс параметров механики, радиодеталей, магнитных покрытий и головок.

Поэтому все современные винты при изготовлении проходят индивидуальную настройку, в процессе которой подбираются такие параметры электрических сигналов, при которых устройству работается лучше.

Эта настройка осуществляется специальной программой при технологическом сканировании поверхности. При этом генерируются так называемые адаптивы — переменные, в которых содержится информация об особенностях конкретного гермоблока. Адаптивы сохраняются на дисках в служебной зоне, а иногда во Flash-памяти на плате контроллера.

В процессе эксплуатации винта адаптивы могут быть разрушены разрушены

«Адаптивные» бэды отличаются от обычных тем, что они «плавающие». Лечатся адаптивные бэды прогоном selfscan’а — внутренней программы

тестирования, аналогичной той, что применяется на заводе при изготовлении винтов. При этом создаются новые адаптивы, и винт возвращается к нормальному состоянию. Это делается в условиях фирменных сервис-центров.

96

Техническое обслуживание средств вычислительной техники Учебно-методическое пособие

3.1.7. Неисправности аппаратной части НЖМД их характер проявления, методика их устранения

Типовые причины возникновения неисправностей аппаратной части НЖМД можно условно разделить на следующие группы:

Неисправности из-за естественного старения НЖМД;

Неисправности, обусловленные неверным режимом эксплуатации;

Неисправности, связанные с ошибками в конструкции.

Неисправности из-за естественного старения НЖМД.

Неисправности из-за естественного старения НЖМД

При правильной эксплуатации с соблюдением всех технических требований

вкачественно изготовленном накопителе наблюдается процесс естественного старения. Сильнее всего ему подвержены магнитные диски.

Во-первых, со временем ослабевает намагниченность минимальных информационных отпечатков, и те участки дисков, которые раньше читались без проблем, начинают считываться не с первого раза или с ошибками.

Во-вторых, происходит старение магнитного слоя дисков.

В-третьих, на пластинах появляются царапины, сколы, трещины и пр. Все это приводит к появлению поврежденных секторов.

Процесс нормального старения дисков достаточно длительный и обычно растягивается на 3…5 лет.

Следует отметить, что для НЖМД наиболее благоприятным является непрерывный режим работы, а не старт/стопный. Поэтому довольно долго служат накопители в постоянно работающих серверах, расположенных в специальном помещении или стойке, где поддерживаются нормальные климатические условия.

Неисправности, обусловленные неверным режимом эксплуатации

Являются наиболее распространенная причина отказов НЖМД к основным разрушающим факторам которого относятся:

перегрев,

ударные нагрузки

скачки напряжения питания.

Важным температурным показателем является скорость изменения температуры, которая не должна превышать 20°С/час в рабочем состоянии и 30°С/час в нерабочем. Превышение скорости разогрева очень опасно для механики накопителей и называется термическим ударом.

Механические воздействия на гермоблок губительны для прецизионных механических частей накопителя. Ударное воздействие на гермоблок вызывает колебания головок, которые производят серию ударов по поверхности дисков, что неизбежно приводит к механическим повреждениям пластин и головок.

Серьезную опасность для электронной части НЖМД может представлять некачественный блок питания персонального компьютера. Напряжения питания должны находиться в пределах +5 В ± 5% и +12 В ± 10% при допустимой амплитуде пульсаций 100 мВ и 200 мВ соответственно.

97

Техническое обслуживание средств вычислительной техники Учебно-методическое пособие

Неисправности, связанные с ошибками в конструкции

В последнее время качество НЖМД снизилось, о чем свидетельствует значительное сокращение гарантийного срока эксплуатации основными производителями.

Плохой контакт в игольчатом разъеме, соединяющем плату электроники и микросхему предусилителя на блоке головок. В результате плохого контакта в разъеме происходит запись неверной информации в технологические байты сектора, например в поле CRC-кода. Этот дефект может привести к повреждению служебной информации, восстановить которую накопитель при следующем включении питания не сможет.

Некачественная пайка микросхем на заводе-изготовителе. Такие дефекты проявляются примерно через год эксплуатации накопителя, когда во время нормальной работы накопитель вдруг выключается и больше не запускается («зависает») либо начинает «стучать» головками, что может привести к повреждению механики и/или служебной информации.

Некачественные микросхемы, которые выходят из строя при длительном нагреве, не превышающем допустимые пределы. Дефект можно исправить заменой микросхемы.

Несовершенная конструкция гидродинамического подшипника, приводящая к возникновению в полости смазки частиц стружки и, как следствие, заклиниванию шпиндельного двигателя.

Некачественное крепление диска на шпинделе, в результате чего биение диска постоянно возрастает и вызывает разрушение подшипника в шпиндельном двигателе; появляется шум при работе накопителя, а через некоторое время — дефектные секторы, поскольку из-за биения диска «дальние» дорожки начинают плохо считываться.

Некачественные микросхемы ЭППЗУ (flash), которые могут потерять хранимую в них микропрограмму вследствие утечки заряда при нагреве. Перезаписать ПЗУ можно на специальном программаторе либо в технологическом режиме работы накопителя.

Ошибки в микропрограмме управления накопителем. Производители накопителей не публикуют информацию о характере ошибок и их последствиях, но обновления микропрограмм выпускают достаточно регулярно.

Симптомы неисправности диска Первая и самая популярная — при подаче питания на диск с ним не

происходит вообще ничего, он полностью молчит и даже не раскручивает шпиндельный двигатель, либо пытается это делать, но не набирает нужные обороты. Подобный симптом может присутствовать оттого, что заклинило сам двигатель, либо головки упали на диск и прилипли к нему (такое бывает практически на всех современных дисках, т.к. головки идеально отполированы и возникает эффект диффузии).

Вторая неисправность — диск нормально раскручивается, но отсутствует распарковка головок — характерный тихий щелчек. Подобное возникает редко, т.к. часто управление позиционированием головок (сервосистема) и трехфазный

98

Техническое обслуживание средств вычислительной техники Учебно-методическое пособие

генератор для шпиндельного двигателя размещены на одном кристалле, и если и выходит из строя, то как правило все сразу или распарковки не происходит потому, что оборвалась катушка позиционирования на блоке головок.

Третья неисправность — диск нормально рекалибруется при включении питания и не издает посторонних звуков, но при этом не определяется в BIOS, а название модели не соответствует тому, которое написано на самом диске, либо в названии присутствуют непонятные символы. В таком случае очень часто бывает неисправен главный интерфейсный чип на плате электроники. Производить запись на такой накопитель категорически не рекомендуется, т.к. в следствие неисправности шины данных можно повредить данные на диске.

Четвертая неисправность — связанная с дефектом микросхем, которые деградируют от постоянных тепловых расширений (температурного градиента). Проявляется неисправность в основном с прогревом, т.е. какое то время диск отлично работает, а затем начинает скрежетать , стучать или останавливать двигатель.

Неисправности аппаратной части НЖМД IDE можно разделить на следующие группы:

неисправность начальной инициализации;

неисправность схемы управления шпиндельным двигателем;

неисправность схемы управления позиционированием;

неисправность канала чтения-преобразования данных;

неисправность канала записи, схемы предкомпенсации данных;

разрушение служебной информации.

Неисправности начальной инициализации приводят, как правило, к

полной неработоспособности накопителя.

В НЖМД с такой неисправностью очень часто даже шпиндельный двигатель не запускается (в следствие того, что управляющий микропроцессор не выдаст разрешение на запуск) или запускается, затем останавливается и снова запускается и т.д., но во всех случаях НЖМД не формирует код 50Н в регистре состояния.

Основные причины, по которым управляющий микропроцессор накопителя не может выполнить начальную инициализацию:

неисправность схемы сброса;

неисправность кварцевого тактового генератора;

разрушение управляющей микропрограммы в памяти программ;

неисправность управляющего микропроцессора;

неисправность однокристального микроконтроллера.

Для локализации неисправности: Необходимо проверить:

питающие напряжения на управляющем микропроцессоре однокристальном микроконтроллере,

возбуждение кварцевого резонатора, подключенного к управляющему микропроцессору, или приход тактовых импульсов если используется внешний генератор,

99

Техническое обслуживание средств вычислительной техники Учебно-методическое пособие

все схемы синхронизации накопителя.

Проверить схему сброса НЖМД.

Для этого замыкают и размыкают контакты 1 и 2 интерфейсного разъема накопителя и осциллографом наблюдают прохождение сигнала «RESET» на управляющий микропроцессор и однокристальный микроконтроллер.

Если на управляющий микропроцессор приходят тактовые импульсы (или возбуждается кварцевый резонатор, подключенный к микропроцессору) и схема сброса работает, то микропроцессор должен отрабатывать управляющую программу, о чем свидетельствуют импульсы на выводах ALE, RD, WR.

Если кварцевый резонатор, подключенный непосредственно к микропроцессору, не возбуждается или отсутствуют импульсы на выводе ALE,то скорее всего неисправен управляющий микропроцессор накопителя.

Рисунок 41 — Типовая принципиальная схема управления шпиндельным двигателем

Неисправность схемы управления шпиндельным двигателем.

Если при включении питания накопителя шпиндельный двигатель не запускается, необходимо убедиться в исправности гермоблока, подключив к нему исправную плату электроники.

Если такой возможности нет, то проверяют сопротивление обмоток (фаз) шпиндельного двигателя, которое должно составлять примерно 2 Ом относительно среднего вывода, а затем переходят к поиску неисправности на плате управления.

Иногда запуск шпиндельного двигателя невозможен из-за прилипания магнитных головок к дискам.

Критериями запуска шпиндельного двигателя являются:

Наличие питающего напряжение на микросхеме управления,

Наличие опорной тактовой частоты

Наличие сигнала разрешения на запуск.

100

Привет, мой друг, тебе интересно узнать все про особенности конструкции современных нжмд виды дефектов магнитного диска нжмд, тогда с вдохновением прочти до конца. Для того чтобы лучше понимать что такое
особенности конструкции современных нжмд виды дефектов магнитного диска нжмд , настоятельно рекомендую прочитать все из категории Диагностика, обслуживание и ремонт электронной и радиоаппаратуры.

Современный накопитель на жестких магнитных дисках (НЖМД) представляет собой сложное электронно-механическое устройство. Элементы накопителя размещены на электронной плате и гермоблоке (см. Рисунок36). Основным элементом, размещенным на электронной плате является микроконтроллер (специализированная микроЭВМ), который управляет работой всех устройств накопителя и организует связь с ЦП. Все данные подлежащие хранению размещаются на магнитном диске, который имеет следующую логическую организацию (см. рис 37 ): 

3.1.6. ОСОБЕННОСТИ КОНСТРУКЦИИ СОВРЕМЕННЫХ НЖМД, ВИДЫ ДЕФЕКТОВ МАГНИТНОГО ДИСКА НЖМД 
Рисунок 37 – Структурная схема НЖМД 
3.1.6. ОСОБЕННОСТИ КОНСТРУКЦИИ СОВРЕМЕННЫХ НЖМД, ВИДЫ ДЕФЕКТОВ МАГНИТНОГО ДИСКА НЖМД 
Рисунок 38 – Схема размещения данных на диске

Служебная информация

Служебная информация необходима для функционирования самого НЖМД и скрыта от пользователя. Служебную информацию можно разделить на четыре основных типа:

  • серво-информацию, или серворазметку;
  • формат нижнего уровня;
  • резидентные микропрограммы (рабочие программы);
  • таблицы конфигурации и настройки
  • таблицы дефектов.

Серворазметка необходима для работы сервосистемы привода магнитных

головок НЖМД. Именно по серворазметке осуществляется их позиционирование и удержание на дорожке. Сервисная разметка записывается на диск в процессе производства через специальные технологические окна в корпусе собранного гермоблока. Запись осуществляется собственными головками накопителя при помощи специального высокоточного прибора — серворайтера. Перемещение позиционера головок осуществляется специальным толкателем серворайтера по калиброванным шагам, которые намного меньше межтрековых интервалов.

Рабочие программы (микрокод) управляющего микроконтроллерапредставляют собой набор программ, необходимых для работы НЖМД. К ним относятся программы первоначальной диагностики, управления вращением двигателя, позиционирования головок, обмена информацией с дисковым контроллером, буферным ОЗУ и т.д.

Производители жестких дисков размещают часть микропрограмм на магнитном носителе не только для экономии объема ПЗУ, но и для возможной оперативной коррекции кода, если в процессе производства или эксплуатации обнаруживаются ошибки. Переписать микропрограмму на диске значительно проще, чем перепаивать «прошитые» микроконтроллеры.

Таблицы конфигурации и настройки накопителей содержат информациюо логической и физической организации дискового пространства. Они необходимы для самонастройки электронной части диска, которая одинакова для всех моделей семейства.

Таблицы дефектов. (дефект-лист) содержит информацию о выявленныхдефектных секторах

Современные винчестеры имеют как правило два основных дефект-листа:

  • Первый P-list(«Primary»-первичный) заполняется на заводе при изготовлении накопителя;
  • Второй G-list («Grown»  растущий), и пополняется в процессе эксплуатации винта, при появлении новых дефектов.

Кроме того, некоторые НЖМД имеют еще

  • лист серво-дефектов (сервометки, наносимые на пластины винчестеров, тоже иногда имеют ошибки),
  • список  временных  (pending)  дефектов.  В  него  контроллер  заносит«подозрительные» с его точки зрения секторы, например те, что прочитались не с первого раза, или с ошибками.

Технология  изготовления  магнитных  дисков  очень  сложная,  контроль

состояния поверхности диска осуществляется на всех этапах изготовления, но даже это не позволяет получить поверхность магнитного диска без дефектов. В ходе эксплуатации диска количество дефектов возрастает . Об этом говорит сайт https://intellect.icu . Поэтому производители накопителей предусмотрели специальные методы скрытия дефектов, которые позволяют скрыть дефекты как при производстве так и при эксплуатации.

Методы  скрытия  дефектных  секторов  (при  производстве  дисков).  В

наспоящее время припроизводстве дисков используется несколько основных методов скрытия дефектов.

Первый заключается в переназначении адреса испорченных секторов в на адрес резервного сектора (Рисунок 38).

Метод вызывает потерю производительности НЖМД, так как он, каждый раз обнаруживая сектор, помеченный как негодный, будет вынужден перемещать головки в резервную область, которая может находиться далеко от места дефекта.

Такой метод скрытия дефектов получил название «метод замещения» или ремап (от английского «re-map»: перестройка карты секторов). В настоящее время при производстве не применяется. 

3.1.6. ОСОБЕННОСТИ КОНСТРУКЦИИ СОВРЕМЕННЫХ НЖМД, ВИДЫ ДЕФЕКТОВ МАГНИТНОГО ДИСКА НЖМД 
Рисунок 39 — Методы переназначения сектора

Второй (основной) способ использует следующий алгоритм: после выявления всех дефектов, адреса всех исправных секторов переписываются заново, так, чтобы их номера шли по порядку. Плохие сектора просто игнорируются и в дальнейшей работе не участвуют. Резервная область также остается непрерывной и ее часть присоединяется к концу рабочей области — для выравнивания объема. Этот, второй основной тип скрытия дефектов получил название «метод пропуска сектора».Новый диск не имеет Bad-секторов, а

резервная область непрерывна! 

3.1.6. ОСОБЕННОСТИ КОНСТРУКЦИИ СОВРЕМЕННЫХ НЖМД, ВИДЫ ДЕФЕКТОВ МАГНИТНОГО ДИСКА НЖМД 
Рисунок 40 — Метод пропущенного сектора

Методы скрытия дефектных секторов при эксплуатации дисков Для скрытия дефектов в бытовых условиях применяется «метод

замещения» Ремап Замещение выполняется в автоматическом режиме эта технология получила

название automatic defect reassignment (автоматическое переназначение дефектов), а сам процесс — reassign.

Работает ремап следующим образом:

если при попытке обращения к сектору происходит ошибка, контроллер понимает, что данный сектор неисправен, и «на лету» помечает его как BAD.

Его адрес тут же заносится в таблицу дефектов (G-list).

Во время работы контроллер постоянно сравнивает текущие адреса секторов с адресами из таблицы и не обращается к дефектным секторам. Вместо этого он переводит головки в резервную область и читает сектор оттуда. На характеристике диска Vчтения=F(Nдор), как небольшие провалы на графике чтения. Тоже самое будет и при записи.

Система оперативного наблюдения за состоянием HDD — S.M.A.R.T.

Почти все винчестеры, выпущенные после 95-го года, имеют систему оперативного наблюдения за своим состоянием — S.M.A.R.T. (Self Monitoring And Reporting Technology).

Между атрибутами SMART и состоянием поверхности существует некоторая взаимосвязь. Некоторые имеют прямое отношение к bad-блокам:

Reallocated sector count и Reallocated event count: число переназначенныхсекторов. Эти атрибуты показывают количество секторов, переназначенных ремапом в G-list дефект-лист. У новых винтов они обязательно должны быть равны нулю! Если их значение отличается от нуля, то это означает, что винт уже был в употреблении.

Raw read error rate: количество ошибок чтения. Это «мягкие» ошибки, успешно скорректированные электроникой накопителя и не приводящие к искажению данных. Опасно, когда этот параметр резко снижается за короткий срок, переходя в желтую зону. Это говорит о серьезных проблемах в накопителе.

Current Pending Sector: этот атрибут отражает содержимое «временного» дефект-листа, присутствующего на всех современных накопителях, т.е. текущее количество нестабильных секторов. Эти секторы винт не смог прочесть с первого раза. Постоянное значение этого атрибута выше нуля говорит о неполадках в накопителе.

Uncorrectable Sector: показывает количество секторов, ошибки в которых не удалось скорректировать ECC-кодом. Если его значение выше нуля, это означает, что винту пора делать ремап.

Виды дефектов магнитного диска НЖМД 
Дефекты поверхности НЖМД делятся на следующие группы:

  1. Физические дефекты, которые подразделяются на:
    • Дефекты поверхности.
    • Серво-ошибки
    • Аппаратные BAD’ы.
  2. Логические дефекты, которые подразделяются на:
    • Исправимые логические дефекты (софт-бэды)
    • Неисправимые логические ошибки.
    • «Адаптивные» бэды.

Дефекты поверхности. Возникают при механическом повреждении магнитного покрытия внутри пространства сектора, например из-за царапин, вызванных пылью, старением блинов или небрежным обращением с винтом. Такой сектор должен быть помечен как негодный и исключен из обращения.

Серво-ошибки. По сервометкам происходит стабилизация скорости вращения двигателя и удержание головки на заданном треке, независимо от внешних воздействий и тепловой деформации элементов.

Однако в процессе эксплуатации диска, некоторые сервометки могут оказаться разрушены. Если плохих сервометок станет слишком много, в этом месте начнут происходить сбои при обращении к информационной дорожке: головка, вместо того, чтобы занять нужное ей положение и прочитать данные, начнет шарахаться из стороны в сторону. Наличие таких ошибок часто сопровождается стуком головок, зависанием накопителя и невозможностью исправить его обычными утилитами. Устранение таких дефектов возможно только специальными программами, путем отключения дефектных дорожек, а иногда и всей дисковой поверхности.

Самостоятельно НDD восстановить сервоформат не может, это делается только на заводе.

Аппаратные BAD’ы. Возникают из-за неисправности механики или электроники накопителя. К таким неполадкам относятся:

  • обрыв головок;
  • смещение дисков;
  • погнутый вал в результате удара;
  • запыление гермозоны;
  • различные «глюки» в работе электроники.

Ошибки такого типа обычно имеют катастрофический характер и не подлежат исправлению программным путем.

Исправимые логические дефекты (софт-бэды): появляются, если контрольная сумма сектора не совпадает с контрольной суммой записанных в него данных.

Возникает из-за помех или отключения питания во время записи, когда HDD уже записал в сектор данные, а контрольную сумму записать не успел.

При последующем чтении такого «недописанного» сектора произойдет сбой: винт сначала прочитает поле данных, потом вычислит их контрольную сумму и сравнит полученное с записанным. Если они не совпадут, контроллер накопителя решит, что произошла ошибка и сделает несколько попыток перечитать сектор. Если и это не поможет (а оно не поможет, так как контрольная сумма заведомо неверна), то он, используя избыточность кода, попытается скорректировать ошибку, и если это не получится — винт выдаст ошибку внешнему устройству. Со стороны операционной системы это будет выглядеть как BAD.

Неисправимые логические ошибки. Это ошибки внутреннего формата винчестера, приводящие к такому же эффекту, как и дефекты поверхности. Возникают при разрушении заголовков секторов, например из-за действия на винт сильного магнитного поля. Но в отличие от физических дефектов, они поддаются исправлению программным путем. А неисправимыми они названы только потому, что для их исправления необходимо сделать «правильное»

низкоуровневое форматирование, что обычным пользователям затруднительно из-за отсутствия специализированных утилит.

«Адаптивные» бэды. Несмотря на то, что винты является очень точнымиустройствами, при их массовом производстве неизбежно возникает разброс параметров механики, радиодеталей, магнитных покрытий и головок.

Поэтому все современные винты при изготовлении проходят индивидуальную настройку, в процессе которой подбираются такие параметры электрических сигналов, при которых устройству работается лучше.

Эта настройка осуществляется специальной программой при технологическом сканировании поверхности. При этом генерируются так называемые адаптивы — переменные, в которых содержится информация об особенностях конкретного гермоблока. Адаптивы сохраняются на дисках в служебной зоне, а иногда во Flash-памяти на плате контроллера.

В процессе эксплуатации винта адаптивы могут быть разрушены разрушены

«Адаптивные» бэды отличаются от обычных тем, что они «плавающие». Лечатся адаптивные бэды прогоном selfscan’а — внутренней программы

тестирования, аналогичной той, что применяется на заводе при изготовлении винтов. При этом создаются новые адаптивы, и винт возвращается к нормальному состоянию. Это делается в условиях фирменных сервис-центров.

Если я не полностью рассказал про особенности конструкции современных нжмд виды дефектов магнитного диска нжмд? Напиши в комментариях Надеюсь, что теперь ты понял что такое особенности конструкции современных нжмд виды дефектов магнитного диска нжмд
и для чего все это нужно, а если не понял, или есть замечания,
то нестесняся пиши или спрашивай в комментариях, с удовольствием отвечу. Для того чтобы глубже понять настоятельно рекомендую изучить всю информацию из категории
Диагностика, обслуживание и ремонт электронной и радиоаппаратуры

В предыдущих статьях мы неоднократно упоминали о таком явлении, как сбойный (плохой или bad) блок, однако до сих пор не дали точного определения, что же это такое, каковы причины их возникновения, как с ними бороться и нужно ли. В этой статье рассмотрим два первых вопроса и предоставим вам немного времени для собственных размышлений и поисков решений. В следующий раз все-таки поговорим о методах борьбы с ними.

Итак, под bad-блоком понимается обычно конкретный участок диска, нормальная работа с которым не гарантируется или невозможна вовсе. На таких участках может содержаться различная информация, это могут быть данные пользователя или служебная информация (иначе называемая серво (очевидно от лат. servire или англ. serve — служить), в этом случае это чревато последствиями, тяжесть которых варьируется в очень широких пределах), хотя, конечно же, лучшим вариантом было бы отсутствие в этой области чего-либо (правда, столкнуться с бэдами в таких областях скорее не придется). Появление таких секторов может быть обусловлено разными причинами, в одном случае такие секторы можно восстановить, в другом нельзя, в одном нужно использовать одни методы лечения и переназначения в другом другие. Но сначала развеем несколько довольно распространенных мифов.

Миф первый: на современных винчестерах не бывает бэдов. Это неправда, бывают. По большому счету технология та же, что и годы назад, только усовершенствованная и доработанная, но по прежнему не идеальная (впрочем, идеальная вряд ли будет создана на базе технологий магнитной записи).

Миф второй: для винчестеров оснащенных SMART это не актуально (читай там не может быть бэдов). Тоже не так: актуальна, ничуть не меньше чем для винчестеров без SMART (если таковые еще остались). Понятие сбойного сектора для нее родное и близкое, это должно было стать понятно из соответствующих публикаций посвященных этой технологии (ссылки в конце). Дело только в том, что большую часть забот о таких секторах ранее возлагавшуюся на пользователя, SMART взяла на себя. И часто может случиться так, что пользователь вообще ничего не знает и не узнает о имеющих место бэдах на его винте, если конечно ситуация не патологическая. Доводилось слышать от пользователей, что так продавцы порой аргументируют свой отказ в гарантийном обмене винчестеров, у котрых бэды «всплыли» наружу. Продавец, конечно же, не прав. SMART не всемогуща, а бэды пока никто не отменял.

Для того, что бы разобраться в бэдах и их разновидностях, углубимся в метод хранения информации на винчестере, совсем на чуть-чуть. Выясним два момента.

1. Единицей которой оперирует винчестер на низком уровне является сектор. В физическом пространстве на диске, соответствующем сектору, записываются не только непосредственно данные, но и служебная информация — поля идентификации и контрольная сумма для него, данные и контрольный код для них, код для восстановления ошибок и др. (не стандартизировано и зависит от производителя и модели). По наличию полей идентификации различают два вида записи — с полями идентификаторов и без оных. Первый стар и уступил свои позиции в пользу последнего. Позже станет понятно, почему я это отмечаю. Важно также, что имеются средства контроля ошибок (которые как мы увидим, могут стать их источниками).

2. При работе со старыми винчестерами необходимо было прописать в BIOS их физические параметы, которые указывались на этикете, а для того, чтобы однозначно адресовать блок данных, необходимо было указывать номер цилиндра, номер сектора на дорожке, номер головки. Такая работа с диском была полностью зависимой от его физических параметров. Это не было удобным, и связывало руки разрабочикам во многих вопросах. Требовался выход и он был найден в трансляции адресов. Та, которая нас интересует — данные в накопителе решено было адресовывать одним параметром, а функцию определения действительного физического адреса соответствующего этому параметру возложить на контроллер жесткого диска. Это давало терубемую свободу и совместимость.

Реальные физические данные накопителя уже оказывались не важны. Важно только, чтобы число логических блоков указанное BIOS не превышало действительное. Создание такого транслятора имеет огромное значение и для вопросов бэд-секторов тоже. И вот почему. Обработка плохих секторов старых жестких дисках была не совершенна, осуществлялась средствами файловой системы. Диск поставлялся с наклейкой, на которой были указаны адреса дефектных блоков, найденных изготовителем. Пользователь сам в ручную заносил эти данные в FAT, и исключал таким образом исключалось обращение к ним операционной системы.

Технология изготовления пластин была несовершенная тогда, и несовершенна сейчас. Не существует методов создания идеальной поверхности не содержащей ни одного плохого блока, вопреки встречающемуся мнению, что с завода винчестер поставляется без них. С ростом объема дисков росло количество сбойных секторов при выходе с завода, и, понятно, что только до определенного момента процедура их регистрации в FAT могла выполнятся в ручную, нужно было найти способ маркировать бэды, даже не смотря на то, что не известно, какая файловая система будет использоваться. Изобретение транслятора позволило решить эти проблемы. На винчестере выделялась специальная защищенная область, куда записывался транслятор, в котором устанавливалось соответствие каждого логического блока непрерывной цепочки и реального физического адреса.

Если вдруг на поверхности обнаруживался сбойный блок, то он просто пропускался, а данному логическому блоку присваивался адрес следующего физического доступного блока. Транслятор считывался с диска при включении. Создание его выполнялось (и выполняется) на заводе, и именно по этому, а не от того, что производителем применяется какая-то супер технология, новые диски как бы не содержат бэд-блоков. Физические параметры оказались скрыты (и они слишком рознились, так как у фирм оказались развязаны руки в производстве своих собственных форматов низкого уровня, и пользователя это не заботило), дефекты помечались на заводе, универсальность увеличилась. Хорошо как в сказке.

Теперь вернемся к бэдам и их разновидностям. В зависимости от природы происхождения всех их можно подразделить на две большие группы: логические и физические.

Физические и логические дефекты

Дефекты поверхности могут быть связаны с постепенным износом магнитного покрытия дисков, просочившимся через фильтр мельчайшим частицам пыли, кинетическая энергия которых, разогнанных внутри накопителя до колоссальных скоростей, оказывается достаточной для повреждения поверхности дисков (впрочем, скорее всего они скатяться с диска под действием центробежных сил и будут задержаны внутренним фильтром, но напакостить могут успеть), результатом механических повреждений при ударе, при котором могут из поверхности могут выбиться маленькие частицы, которые потом в свою очередь также будут выбивать другие частички, и процесс пойдет лавинообразно (такие частицы тоже будут скатываться с пластин под действием центробежных сил, но значительно дольше и тяжелее, так как будут удерживаемы силами магнитного притяжения. Это еще чревато тем, что с ними будет происходить столкновение головки, парящей на очень малой высоте, что вызовет ее нагрев и ухудшение рабочих характеристик — будут возникать искажения сигнала, результат — ошибки чтения), доводилось слышать (у меня такой статистики нет) что и курение у компьютера способно сделать то же самое, так как табачные смолы способны проникать сквозь воздушный фильтр винчестера (у которых он есть), приводя там к прилипанию головок к пластинам (порче поверхности и головок), просто оседая на поверхности, и меняя тем самым рабочие характеристики и т.д.

Такие сектора к обращению оказываются непригодными и должны быть исключены из обращения. Восстановление их не представляется возможным ни в домашних условиях, ни в условиях сервисных центров. Будет хорошо, если из них удасться хотя бы восстановить информацию. Скорость процесса такого вида разрушения поверхности индивидуальная. Если число бэдов не растет или растет крайне незначительно, то можно серьезно не опасаться (хотя делать резервное копирование все же стоит) если же рост быстрый, то диск придется заменить, и, причем, очень поторопиться. При данном виде бэдов можно произвести переназначение блоков на резервную поверхность: имеет смысл при отсутствии прогрессирования. Но об этом не сейчас. Это если говорить об области данных.
Как уж было отмечено, на пластинах храниться еще и служебная информация. В процессе использования она также может оказаться разрушенной. Это может быть гораздо болезненнее, чем обычной пользовательской поверхности.

Дело в том, что сервоинформация активно используется в процессе работы: по серво меткам происходит стабилизация скорости вращения дисков, удержание головки над заданным цилиндром независимо от внешних воздействий. Незначительные разрушения сервоинформации могут пройти незамеченными. Серьезные повреждения сервоформата могут сделать недоступной какую-то часть диска или весь диск целиком. Поскольку сервоинформацей пользуется программа накопителя и она критически важна для обеспечения нормального функционирования и вообще в силу ее специфики, дела обстоят с ней намного сложнее. Некоторые винчестеры позволяют отключить сбоящие серводорожки. Восстановление же их возможно только на заводе на специальном дорогом и сложном оборудовании (оценим приблизительно расходы на такой ремонт негарантийного винчестера и поймем, что правильно будет назвать этот вид бэдов неисправимым).

К физическим бэдам можно также отнести сбойные сектора, появление которых обусловлено неисправностями электронной или механической части накопителя, например обрыв головок, серьезные механические повреждения в результате удара — заклинивание катушки позиционера или дисков, смещение дисков. Действия здесь могут быть различными и зависеть от конкретной ситуации, если, например, обрыв головки (такие бэды появляются потому, что делается попытка обращения к поверхности, доступ к которой не может быть осуществлен (что вовсе не означает, что что-то не так с поверхностью)), то, например, часто ее можно отключить (а можно и поменять в условиях специализированных сервисных центров, вот только стоиомость операции заставляет серьезно задуматся о ее целесообразности (в большинсте случаев ответ отрицательный), если конечно, речь не идет о необходимости восстановить крайне ценную информацию (но это уже другой разговор)).

В целом же для этого вида повреждений характерен катастрофический характер.
Т.е. как видим физические бэды не лечатся, возможно лишь какое-то «смягчение» их присутствия.
С логическими плохими секторами ситуация проще. Некоторые из них излечимы. В большинстве случаев обусловлены ошибками записи. Можно выделить следующие категории:

1. Самый простой случай: ошибки файловой системы. Сектор помечен в FAT как сбойный, но на самом деле таковым не является. Раньше таким приемом пользовались некторые вирусы, когда на небольшом обьеме винчестера требовалось найти себе укромное местечко, не доступное простыми средствами. Сейчас этот прием не актуален, так как скрыть в недрах Windows пару мегабайт (а то и пару десятков мегабайт) не представляет никакой сложности. Кроме того так кто-то мог просто пошутить над незадачливым пользователем (программы попадались такие). Да и вообще файловая система вещь хрупкая, лечится очень легко и абсолютно без последствий.

2. Неисправимые логические бэды — характерны для старых винчестеров использующих запись с полями идентификаторов. Если у вас такой диск, то вполне можете с ними столкнуться. Обусловлено неверным форматом физического адреса, записанного для данного сектора, ошибка контрольной суммы для него и т.д. Соответственно, невозможно обращением к нему. На самом деле они восстановимы, но на заводе. Поскольку я уже сказал, что сейчас используется технология записи без полей идентификаторов, то эту разновидность можно считать неактуальной.

3. Исправимые логические бэды. Не так уж редко встречаемый, особенно на некоторых типах накопителей тип сбойных блоков. Происхождением в основном обязаны ошибкам записи на диск. Чтение произвести с такого сектора не удается, так как обычно в нем ЕСС код не соответствует данным, а запись обычно невозможна, так как перед записью осуществляется предварительная проверка подлежащего записи пространства, и поскольку с ней уже обнаружены проблемы, запись в данную область отклоняется. Т.е. получается блок невозможно использовать, хотя физически поверхность, им занимаемая в полном порядке. Дефекты подобного рода могут быть иногда вызваны ошибками в микропрограмме винчестера, могут быть спровоцированы программным обеспечением или техническими причинами (напримем перебоем питания и его колебанием, уходом во время записи головки на недопустимую высоту и др.). Но если удается привести в соответствие содержимое сектора и его ECC-код, то такие блоки бесследно проходят. Причем процедура эта не сложна, а средства для ее осуществления широко доступны, и, в общем-то, безобидны.

4. Появления на винчестерах бэд-блоков этого вида обязано особенностям технологии производства: никогда не существует двух абсолютно одинаковых устройств, какие-то их параметры непременно отличатся. При подготовке винчестеров на заводе, для каждого определяется набор параметров, обеспечивающих наилучшее функционирование данного конкретного экземпляра, так называемые адаптивы. Эти параметры сохраняются, и в случае если они каким то загадочным образом оказываются повреждены, то результатом может быть полная неработоспособность диска, нестабильная его работа или большое количество сбойных секторов появляющихся и исчезающих то в одном, то в другом месте. В домашних условиях с этим сделать ничего нельзя, но все можно настроить на заводе или в сервисном центре.

Как видим, реально лечатся в домашних условиях только два вида логических бэдблоков. Другие в случае необходимости можно попробовать подменить на резервные, но не вылечить. С третьими дома сделать ничего нельзя. О том, как и что нужно делать в первых двух случаях будем говорить в следующий раз.

Продолжение следует

HDAT2 — это сервисная утилита, позволяющая выявить и «вылечить» испорченные сектора жёсткого диска (они же bad
-секторы). «Вылечить» — означает «заменить» bad-сектора на исправные из резервной области жёсткого диска.

hdat2: инструкция

Нажмите Enter
.

Наберите в строке hdat2

и нажмите Enter
:

Тест на бэд сектора (bad sector)

Стрелками вверх-вниз
на клавиатуре выберите диск, который Вы ходите проверить на наличие испорченных секторов (BAD-секторов, в народе «бэдов») и нажмите Enter
:

Выберите Device test menu
и нажмите Enter
: (это Вы входите в меню тестов устройства)

Если Вы хотите, чтобы программа нашла и попыталась «вылечить» (заменить) BAD-сектора, выберите Detect and fix
… (Подойдёт, если гарантия на жёсткий диск истекла)

Если хотите, чтобы программа просто сообщила Вам о наличии или отсутствии BAD-секторов, но не исправляла их, то выберите Detect bad sectors menu
.

Важно!

Этот вариант Вам очень понадобится, если Вы хотите убедиться в наличии «бэдов» и не залечивая их предъявить претензию продавцу. Нужно оставить «бэды» как есть, дабы это послужило Вашим аргументом при требовании замены жёсткого диска.

Если Вы выбрали «лечение» испорченных секторов, Вы увидите следующее меню. В нём рекомендуется выбрать первый пункт.

После нажатия на клавишу Enter запустится тест диска. Он может длиться несколько часов, в зависимости от его ёмкости и метода «лечения» «бэдов».

Скажу так: в половине случаев бэд-сектора появляются в количестве 1-3 штуки и после «залечивания» программой HDAT2 не дают о себе знать. Вы дальше пользуетесь винчестером и всё замечательно.
Если же после залечивания «бэдов» регулярно и систематически появляются новые, это означается, что диск «сыпется». В этом случае я рекомендую как можно быстрее купить ему замену, иначе рано или поздно Вы потеряете всю информацию.

Внимание!

Если Вы запустили программу через «Detect Bad Sectors menu
«, и

программа нашла BAD сектора, а Вы надумали их вылечить, Вам придётся перезапустить программу заново
через «Detect and fix bad sectors menu
»
> «Fix with Verify/Write/Verify
»

Время проверки жёстких дисков

Жёсткий диск объёмом 640 ГБ проверяется примерно 1 час 50 минут

Для проверки жёсткого диска объёмом 2 ТБ понадобится примерно 6 часов времени

1. Немного истории

Bad-секторы (от англ. — плохой, негодный) есть на любых винчестерах. Как бы тщательно не были изготовлены их диски, на каждом из них найдется несколько мест, запись или чтение которых сопровождается ошибками. Кроме того, встречаются и просто глючные участки поверхности, которые могут со временем перерасти в дефекты, что для пользователя недопустимо. Поэтому каждый накопитель после изготовления на заводе, проходит тщательное тестирование, в процессе которого выявляются испорченные секторы. Они помечаются как негодные и заносятся в специальную таблицу — дефект-лист

.

Самые первые винты имели дефект-лист в виде бумажной наклейки, в которую на заводе вписывали адреса нестабильных участков. Эти устройства, представляющие собой слегка измененную копию обычного флоппи-дисковода, могли работать только под своими физическими параметрами: число дорожек, секторов и головок, указанное в их паспорте, точно совпадало с их реальным количеством. Приобретая такой девайс, пользователь читал наклейку и сам заносил адреса убитых участков в FAT. После этого операционная система переставала замечать эти дефекты, точно так же, как она не замечает бэд-блоки на дискетах, если они были убраны scandisk»ом. Вероятно, в те далекие времена и появился термин «бэд-блок»: блоком называли кластер

— минимальную единицу логического дискового пространства. На физическом уровне кластер состоит из нескольких секторов, и при повреждении одного сектора ОС объявляет негодным весь кластер. Никаких других методов скрытия дефектов в то время не существовало. А когда появились способы скрывать отдельные секторы, люди не стали выдумывать новые понятия, и до сих пор успешно продолжают пользоваться словом «блок».

Прошло совсем немного времени, прежде чем изготовители додумались до очень интересной вещи: если пользователь все равно помечает bad-блоки, как ненужные, рассудили они, то почему бы не пометить их прямо на заводе? Но как это сделать, если на винте нет никакой файловой системы, и неизвестно, какая будет? Вот тогда и придумали хитрую штуку, называемую «транслятор»
: на блины стали записывать специальную таблицу, в которой отмечалось, какие секторы следует спрятать от пользователя, а какие — оставить ему. Транслятор стал своеобразным промежуточным звеном, соединяющим физическую систему «диски-головки» с интерфейсом накопителя. Предполагалось, что при включении винт сначала прочитает свои внутренние таблицы, скрывая отмеченные в них адреса дефектов, а уже затем допустит к себе BIOS, ОС и прикладные программы. А чтобы пользователь случайно не затер транслятор во время работы, он был помещен в специальную область диска, недоступную обычным программам. Только контроллер винта мог получить доступ к ней. Это событие произвело настоящий переворот в винчестеростроении, и ознаменовало появление нового поколения накопителей — со служебной зоной. Для того, чтобы все винты одной модели, но с разным количеством дефектов, имели одинаковую емкость, на каждом из них стали оставлять запасные дорожки — резерв, специально предусмотренный для выравнивания емкости однотипных накопителей до стандартной заявленной величины. Его стали располагать в конце диска, возле его центра, и он тоже был недоступен пользователю. Такие винчестеры при выходе с завода не имели не одного видимого bad-сектора. Если в процессе эксплуатации появлялись новые дефекты, пользователь мог сделать низкоуровневое форматирование универсальной утилитой из BIOS материнской платы, и попытаться их скрыть. Иногда, как и на дискетах, это удавалось. Но если «нечисть» была физической, то это не помогало: добавить новые дефекты в таблицу и переписать транслятор без специальных программ было невозможно. Поэтому bad-блоки на многих старых винтах (до 1995 года), приходилось скрывать все тем же, устаревшим способом — через FAT. И лишь фирмы Seagate, Maxtor и Western Digital выпустили утилиты для скрытия дефектов с замещением их из резерва (они и по сей день валяются на некоторых ftp и называются sgatfmt4.exe, mformat2.exe и wddiag.exe соответственно).

Прошло время, и винты еще больше изменились. Стремясь увеличить плотность записи, разработчики стали применять различные нестандартные ухищрения: на пластины стали наносить сервометки
, предназначенные для более точного попадания головок на дорожки. Появилась технология зонно-секционной записи (ZBR), смысл которой заключался в разном количестве секторов на внешних и внутренних дорожках. Изменился привод головок — вместо шагового двигателя стали применять позиционер в виде подвижной катушки. Да и сами головки и диски изменились настолько, что каждая фирма разработала свою структуру формата нижнего уровня, заточенную только под их технологии. Это сделало невозможным применение универсальных утилит низкоуровневого форматирования из-за того, что транслятор таких винтов научился скрывать физический формат накопителей, переводя его в виртуальный. Написанное на корпусе винта число цилиндров, секторов и головок, перестало соответствовать своим истинным значениям, и попытки отформатировать такой винт старыми утилитами, как правило, заканчивались неудачно: его контроллер отвергал стандартную ATA-команду 50h, или просто имитировал форматирование, заполняя винт нулями. Это было специально оставлено для совместимости со старыми программами. По этой же причине процедура Low-Level Format была исключена из BIOS современных материнских плат. А чтобы сделать таким винтам настоящее низкоуровневое форматирование, нужно было обойти транслятор, получив прямой доступ к физическим дорожкам и головкам. Для этого стали использовать технологическую утилиту, запускающую специальный микрокод, записанный в ПЗУ накопителя. Команда вызова этого микрокода — уникальна для каждой модели винта, и относится к технологическим командам

, которые фирмой не разглашаются. Часто такое форматирование нельзя было сделать через стандартный IDE-интерфейс: многие модели винтов выпуска 90-х годов — Conner, Teac и др., а также все современные Seagate, требуют подключения отдельного разъема к терминалу через COM-порт. Что касается технологических утилит, то они никогда широко не распространялись и обычному пользователю были недоступны. Для широкого применения были написаны программы-дурилки, осуществляющие псевдо-форматирование через интерфейс: заполнение диска нулями для очистки его от информации. Это видно даже из названий этих утилит, которые можно найти на сайтах производителей хардов: wdclear, fjerase, zerofill и т.д. Естественно, никаких технологических команд в этих программах нет, и поэтому их можно применять к любым винчестерам. Такие утилиты часто оказываются полезны, помогая избавиться от некоторых видов BAD»ов, о чем мы поговорим чуть позже.

Почему же производители поступили так жестоко, лишив нас возможности делать правильное низкоуровневое форматирование, и скрывать дефекты самостоятельно? На этот вопрос до сих пор не существует единого мнения, но официальный ответ большинства фирм звучит примерно так: «это настолько сложная и опасная операция, что рядового пользователя до нее допускать нельзя, иначе многие винты будут попросту убиты. Поэтому низкоуровневое форматирование можно делать только на заводе, или в фирменном сервис-центре».

Попробуем разобраться, так ли это на самом деле. А заодно рассмотрим, что же такое настоящее низкоуровневое форматирование современных винчестеров, можно ли его делать самому, и что самое главное — нужно ли нам оно?

2. Подготовка винчестера на заводе

Перед скрытием bad»ов на заводе очень важно выявить все, даже очень маленькие дефекты, а также нестабильные участки, которые могут со временем перерасти в bad»ы. Ведь если такое случится в процессе эксплуатации, пользователь может лишиться важного файла, да и репутация фирмы, выпустившей такой «недоделанный» накопитель, будет испорчена. Поэтому тестирование винчестеров перед скрытием дефектов занимает очень много времени, как минимум несколько часов, и выполняется в технологическом режиме. Это сделано для исключения временных задержек, неизбежно возникающих при работе транслятора, пересылке данных через кэш и интерфейсную логику. Поэтому на заводе поверхность сканируют только по физическим параметрам. Обычно этим занимается не внешняя программа, а специальный модуль в ПЗУ винта, работающий без участия интерфейса. Конечным результатом такого тестирование становится получение дефект-листа — электронного списка негодных областей дискового пространства. Он заносится в служебную зону винта и храниться там на протяжении всего срока эксплуатации накопителя.

Современные винчестеры имеют два основных дефект-листа: один заполняется на заводе при изготовлении накопителя и называется P-list (-первичный), а второй называется G-list (от слова — растущий), и пополняется в процессе эксплуатации винта, при появлении новых дефектов. Кроме того, некоторые винты (в частности — Quantum Fireball серий ST и TM), имеют еще и лист серво-дефектов (сервометки, наносимые на пластины винчестеров, тоже иногда имеют ошибки), а многие современные модели содержат еще и список временных (pending) дефектов. В него контроллер заносит «подозрительные» с его точки зрения секторы, например те, что прочитались не с первого раза, или с ошибками.

Получив дефект-лист, приступают к скрытию дефектов. Существует несколько способов их скрытия, каждый из которых имеет свои особенности. Теоретически можно просто переназначить адреса испорченных секторов в резерв и брать их оттуда, но это вызовет потерю производительности винта, так как он, каждый раз обнаруживая сектор, помеченный как негодный, будет вынужден перемещать головки в резервную область, которая может находиться далеко от места дефекта. Если переназначенных секторов будет много — производительность накопителя очень сильно упадет, так как большую часть времени он будет затрачивать на бесполезное дёрганье головками. Более того, быстродействие винтов с разным количеством дефектов будет сильно различаться, что конечно же, при массовом производстве недопустимо. Такой метод скрытия дефектов получил название «метод замещения»
или ремап
(от английского: remap — перестройка карты секторов).

Из-за многочисленных недостатков, присущих ремапу, при промышленном изготовлении винтов такой метод никогда не применяют, а используют другой алгоритм: после выявления всех дефектов, адреса всех исправных секторов переписываются заново, так, чтобы их номера шли по порядку. Плохие сектора просто игнорируются и в дальнейшей работе не участвуют. Резервная область также остается непрерывной и ее часть присоединяется к концу рабочей области — для выравнивания объема. Такой способ скрытия бэдов сложнее в реализации, чем ремап, но результат стоит затраченных на него усилий — при любом количестве неисправных секторов, замедления работы накопителя не происходит. Этот, второй основной тип скрытия дефектов получил название «метод пропуска сектора»
. (Существуют и другие алгоритмы заводского скрытия дефектов, например путем исключения целой дорожки, или при помощи запасного сектора на каждой дорожке, но они имеют недостатки и поэтому в современных накопителях практически не используются).

Процесс пересчета адресов с пропуском дефектов получил название «внутреннее форматирование». Внутреннее — потому, что весь процесс происходит полностью внутри винта, по физическим адресам и без участия интерфейса. В это время винт находится под управлением встроенной в его ПЗУ микропрограммы, которая анализирует дефект-лист и управляет форматированием. Внешними командами прервать ее нельзя. По окончании форматирования микропрограмма автоматически пересчитывает транслятор (или создает его заново), и винт становится готов к употреблению. После этого он, без единого бэд-блока, поступает с завода к покупателю.

3. Новые технологии

Теперь понятно, почему фирменные утилиты не делают никаких операций, связанных с прямым доступом к служебной области. Ведь скрытие дефектов форматированием — это практически полный ремонтный цикл, основанный на внешних параметрах и связанный с четким пониманием каждого шага. И достаточно сделать что-то неправильно, чтобы угробить накопитель. Приведем простой пример: пользователь решил сделать «настоящее» низкоуровневое форматирование путем запуска подпрограммы ПЗУ в технологическом режиме. Процесс обычно длится 10-60 минут, но тут случается перебой с питанием или банальное зависание — и винт остается без транслятора, т.к. просто не успевает его заново создать. Это означает, что к дальнейшей работе такой девайс будет непригоден — его просто не увидит ни ОС, ни BIOS. Страшно даже представить, сколько накопителей может быть убито таким образом, из простого любопытства или по ошибке. Особенно, если эти утилиты попадут в руки чайников, запускающих на своих компах все подряд и нажимающих RESET вместо. Конечно, диск портится не безвозвратно, и повторным запуском форматирования можно вернуть его к жизни. Но мышление у большинства пользователей устроено так, что столкнувшись с проблемами (не определяющийся в BIOS труп вместо винта), многие впадают в панику, обвиняя во всем производителей. А им лишний геморрой, естественно не нужен — гораздо важнее заставить винт отработать гарантийный срок. Поэтому несколько лет назад в накопители стали закладывать возможность самостоятельно «ремонтировать» сбойные участки — делать ремап. Как было сказано раньше, ремап не нашел применения при заводской подготовке накопителей, но оказался очень удачным решением для скрытия дефектов в бытовых условиях. Преимущества ремапа перед внутренним форматированием — отсутствие перевода винта в технологический режим, быстрота проведения и безопасность для накопителя. Кроме того, во многих случаях ремап можно делать без сноса файловой системы, и без связанного с этим уничтожения данных. Эта технология получила название automatic defect reassignment (автоматическое переназначение дефектов), а сам процесс — reassign. Таким образом remap и reassign — это по большому счету одно и тоже, хотя термин reassign обычно применяют к отдельному сектору, а remap — ко всему диску.

Работает ремап следующим образом: если при попытке обращения к сектору происходит ошибка, «умный» контроллер понимает, что данный сектор неисправен, и «на лету» помечает его как BAD. Его адрес тут же заносится в таблицу дефектов (G-list). У многих винтов это происходит настолько быстро, что пользователь даже не замечает обнаружение дефекта и его скрытие. Во время работы винт постоянно сравнивает текущие адреса секторов с адресами из таблицы и не обращается к дефектным секторам. Вместо этого он переводит головки в резервную область и читает сектор оттуда. К сожалению, из-за времени, затрачиваемого на дальнее позиционирование, такие секторы будут выглядеть, как небольшие провалы на графике чтения. Тоже самое будет и при записи. Поэтому инженеры фирмы Quantum пошли еще дальше и почти устранили основной недостаток ремапа, воплотив свои идеи во многих моделях серии Fireball: у этих накопителей имеется по одному запасному сектору на каждой дорожке, ремап происходит в этот сектор, и задержки практически отсутствуют.

Если ошибка возникает во время обычной работы ОС, автоматический ремап происходит крайне редко. Это связано с тем, что, на большинстве хардов, reassign срабатывает только при записи. А многие ОС перед записью проверяет сектор на целостность, и обнаруживая ошибку, отказывается в него писать. Поэтому, в большинстве случаев для производства ремапа винт надо об этом «попросить» — произвести принудительную низкоуровневую перезапись сектора в обход стандартных функций ОС и BIOS. Это делается программой, способной обращаться к винту напрямую через порты IDE-контроллера. Если во время такой записи возникнет ошибка, контроллер автоматически заменит этот сектор из резерва, и BAD исчезнет.

На этом принципе основана работа большинства утилит так называемого «низкоуровневого форматирования» от производителей. Все они, при желании, могут использоваться для винтов других фирм (если такие проги отказываются работать с чужими хардами — это сделано по маркетинговым соображениям. Такой жадностью страдает, например фирма Fujitsu). И конечно же, функции ремапа присутствуют во многих универсальных и бесплатных программках, особенности использования которых мы рассмотрим чуть позже. А пока — еще немного теории:)

Наиболее распространенным мифом среди пользователей является утверждение, что для каждого винта нужна своя, «особая» программа скрытия дефектов, а также то, что ремап — это низкоуровневое форматирование. На самом деле это не так. Ремап — это всего лишь разновидность записи информации стандартными средствами, и в большинстве случаев любые утилиты для ремапа могут применяться к любым винтам. Ремап делают не внешние программы, а контроллер винта. Только он принимает решение о переназначении дефектных секторов. Испортить накопитель «чужие» программы тоже не могут, так как технологические команды в них не используются, а в обычном режиме винт никогда не позволит сделать с собой ничего, кроме стандартных операций чтения-записи. Единственное различие между фирменными утилитами заключается в количестве попыток записи/чтения/верификации для разных винтов. Для того, чтобы контроллер «поверил», что в секторе имеется подлежащий скрытию BAD, некоторым хардам достаточно одного цикла, а другим — нескольких.

4. Снова о S.M.A.R.T.

Почти все винчестеры, выпущенные после 95-го года, имеют систему оперативного наблюдения за своим состоянием — S.M.A.R.T. (Self Monitoring And Reporting Technology). Эта технология позволяет в любое время оценить такие важные параметры накопителя, как количество отработанных часов, число возникших в процессе чтения/записи ошибок и многое другое. Первые винчестеры, оснащенные этой системой (например WD AC21200) имели очень несовершенный SMART из четырех-шести атрибутов. Но вскоре был разработан стандарт SMART-II, и с момента его появления в большинстве накопителей появилась такая особенность, как внутренняя диагностика и самоконтроль. Эта функция основана на проведении серии автономных внутренних тестов, которые можно запустить стандартными ATA-командами, и предназначена для углубленного контроля за состоянием механики накопителя, поверхности дисков и многих других параметров. После выполнения тестов, накопитель в обязательном порядке обновляет показания во всех SMART-атрибутах, в соответствии со своим текущим состоянием. Время тестирования может варьироваться от нескольких секунд (Quantum) до 54 минут (Fujitsu MPG). Активизировать тесты SMART можно, например, программой MHDD (консольная команда «smart test»). После запуска тестов возможны «странные» явления, очень похожие на те, что возникают при работе дефрагментатора: непрерывное горение индикатора HDD и звук интенсивного движения головок. Это нормальное явление: винт сканирует поверхность для поиска дефектов. Нужно просто подождать некоторое время, пока самотестирование закончится, и винт успокоится.

Совсем недавно появилась спецификация SMART-III, в которой имеется не только функция обнаружения дефектов поверхности, но и возможность их восстановления «на лету» и многие другие новшества. Одной из его разновидностей стала система Data Lifeguard, применяемая в новых накопителях Western Digital. Ее суть заключается в следующем: если к винту не происходит никаких обращений, он начинает самостоятельно сканировать поверхность, выявляя нестабильные секторы, и при их обнаружении переносит данные в резервную область. После чего делает ему reassign. Таким образом данные оказываются спасены еще до того, как на этом месте возникнет настоящий BAD. В отличие от SMART-мониторинга, Data Lifeguard не может быть отключен внешними командами и работает постоянно. Поэтому «видимые» BAD-блоки на современных винчестерах Western Digital практически никогда не появляются.

Для просмотра smart-статуса жесткого диска используют программы, называемые smart-мониторами. Один из них входит в состав комплекса HddUtil для DOS и называется smartudm. Скачать его можно здесь: www.sysinfolab.com/files/smartudm.zip . Эта программа работает с любыми жесткими дисками и контроллерами. Кроме того, в комплекте с этой прогой идет подробная документация с описанием всех атрибутов. Существуют SMART-мониторы и для Windows 9x, например, очень популярны SiGuardian (http://www.siguardian.ru/) и SmartVision (www.acelab.ru/products/pc/utility.smart203.zip), но они могут не работать на некоторых системах. Объясняется это тем, что программы работают с винтом напрямую, через порты, а bus mastering-драйвера некоторых чипсетов мешают этому. Обладателям Windows XP стоит обратить внимание на монитор SmartWiew www.upsystems.com.ua/ — прога корректно работает в этой системе даже на чипсетах VIA.

Между атрибутами SMART и состоянием поверхности существует некоторая взаимосвязь. Рассмотрим те из них, которые имеют прямое отношение к bad-блокам:

Reallocated sector count и Reallocated event count
: число переназначенных секторов. Эти атрибуты показывают количество секторов, переназначенных ремапом в Grown дефект-лист. У новых винтов они обязательно должны быть равны нулю! Если их значение отличается от нуля, то это означает, что винт уже был в употреблении, на нем появлялись бэды, и ему был сделан ремап. А у винтов Fujitsu эти атрибуты могут самопроизвольно увеличиваться из-за некачественного питания. Будьте внимательны при покупке б/у!

Raw read error rate
: количество ошибок чтения. У многих хардов (например у Seagate и Fujitsu) они всегда выше нуля, но если значение Value находится в пределах нормы (зеленая зона), опасаться нечего. Это «мягкие» ошибки, успешно скорректированные электроникой накопителя и не приводящие к искажению данных. Опасно, когда этот параметр резко снижается за короткий срок, переходя в желтую зону. Это говорит о серьезных проблемах в накопителе, о возможном появлении бэдов в ближайшее время, и о том, что пора делать backup важных данных.

Current Pending Secto
r: этот атрибут отражает содержимое «временного» дефект-листа, присутствующего на всех современных накопителях, т.е. текущее количество нестабильных секторов. Эти секторы винт не смог прочесть с первого раза. Поле raw value этого атрибута показывает общее количество секторов, которые накопитель в данный момент считает претендентами на remap. Если в дальнейшем какой-то из этих секторов будет прочитан (или переписан) успешно, то он исключается из списка претендентов. Постоянное значение этого атрибута выше нуля говорит о неполадках в накопителе.

Uncorrectable Sector
: показывает количество секторов, ошибки в которых не удалось скорректировать ECC-кодом. Если его значение выше нуля, это означает, что винту пора делать ремап: не исключено, что во время записи данных ОС нарвется на этот сектор и в результате какая-нибудь важная инфа или системный файл окажутся испорчены. Однако, у некоторых винтов, например у Fujitsu MPG, этот атрибут почему-то не сбрасывается и после ремапа, поэтому доверять его показаниям необязательно.

5. Виды дефектов и причины их появления

Настало время разобраться, а отчего, собственно, возникает такая неприятность, как бэды? В UPGRADE #49 мы рассмотрели лишь внешние причины, способствующие их возникновению. А теперь пришло время взглянуть на проблему с другой точки зрения — со стороны самого винчестера. Для этого рассмотрим структуру сектора, в том виде, каким его видит электроника винта «изнутри»:

Рис. 1. Упрощенная структура сектора жесткого диска.

Как видно из рисунка 1, все намного сложнее, чем могло показаться на первый взгляд, даже с помощью дискового редактора. Сектор состоит из заголовка-идентификатора и области данных. Начало сектора помечается специальным байтом — адресным маркером (1). Он служит для сообщения контроллеру о том, что сектор находится под головкой. Затем следуют ячейки, в которых содержится уникальный адрес сектора в формате CHS (2) и его контрольная сумма — для проверки целостности записанного адреса (3). 512 байт данных пользователя помещаются в отдельном поле (4), к которому при записи добавляется несколько десятков байт избыточной информации, предназначенной для коррекции ошибок чтения с помощью ECC-кода (5). Рядом с данными размещается 4 байта циклической контрольной суммы (CRC) данных, которая служит для проверки целостности данных пользователя, и сообщения системе коррекции ошибок при ее нарушении (6). Для более надежной работы сектора при колебаниях скорости вращения имеются байты-пробелы (7). У некоторых винчестеров имеется дополнительный байт после AM — в нем сектор помечается как BAD.

Пока структура формата не нарушена, винчестер работает исправно, четко выполняя свои обязанности — хранение информации. Но стоит вмешаться злым силам — и в зависимости от вида разрушений, они проявляются как BAD»ы разной степени тяжести.

Дефекты можно разделить на две большие группы: физические и логические. Рассмотрим каждый их вид подробно.

Физические дефекты

Дефекты поверхности. Возникают при механическом повреждении магнитного покрытия внутри пространства сектора, например из-за царапин, вызванных пылью, старением блинов или небрежным обращением с винтом. Такой сектор должен быть помечен как негодный и исключен из обращения.

Серво-ошибки
. У всех современных накопителей для перемещение головок используется система, получившая название (звуковая катушка), которая в отличие от шагового двигателя старых винтов, не имеет какой-либо дискретности перемещения. Для точного попадания головок на дорожки в винтах используется система с обратной связью, которая ориентируются по специальным магнитным сервометкам, нанесенным на диск. Сервометки имеются на каждой стороне каждого диска. Они расположены равномерно вдоль всех дорожек, и строго радиально, как спицы в колесе, образуя сервоформат. Он не относится к формату нижнего уровня и на рисунке не показан, но имеется абсолютно у всех современных винчестеров, и играет важнейшую роль. По сервометкам происходит стабилизация скорости вращения двигателя и удержание головки на заданном треке, независимо от внешних воздействий и тепловой деформации элементов.

Однако в процессе эксплуатации винта, некоторые сервометки могут оказаться разрушены. Если дохлых сервометок станет слишком много, в этом месте начнут происходить сбои при обращении к информационной дорожке: головка, вместо того, чтобы занять нужное ей положение и прочитать данные, начнет шарахаться из стороны в сторону. Это будет выглядеть как жирный и особо наглый BAD, или даже как группа BAD»ов. Их присутствие часто сопровождается стуком головок, зависанием накопителя и невозможностью исправить его обычными утилитами. Устранение таких дефектов возможно только специальными программами, путем отключения дефектных дорожек, а иногда и всей дисковой поверхности. Для этих целей в некоторых накопителях имеется серводефект-лист, хранящий информацию о плохих сервометках. В отличие от P- и G-листа, серводефект-лист используется не транслятором, а всей микропрограммой винта. К секторам, имеющим дефектные сервометки, блокируется доступ даже по физическим параметрам, что позволяет избежать стуков и срывов при обращении к ним. Самостоятельно винт восстановить сервоформат не может, это делается только на заводе.

Аппаратные BAD»ы
. Возникают из-за неисправности механики или электроники накопителя. К таким неполадкам относятся: обрыв головок, смещение дисков или погнутый вал в результате удара, запыление гермозоны, а также различные глюки в работе электроники. Ошибки такого типа обычно имеют катастрофический характер и не подлежат исправлению программным путем.

Логические дефекты

Эти ошибки возникают не из-за повреждения поверхности, а из-за нарушений логики работы сектора. Их можно разделить на исправимые и неисправимые. Логические дефекты имеют такие же внешние проявления, как и физические, и отличить их можно только косвенно, по результатам различных тестов.

Исправимые
логические дефекты (софт-бэды)
: появляются, если контрольная сумма сектора не совпадает с контрольной суммой записанных в него данных. Например из-за помех или отключения питания во время записи, когда винт уже записал в сектор данные, а контрольную сумму записать не успел (рис 1). При последующем чтении такого «недописанного» сектора произойдет сбой: винт сначала прочитает поле данных, потом вычислит их контрольную сумму и сравнит полученное с записанным. Если они не совпадут, контроллер накопителя решит, что произошла ошибка и сделает несколько попыток перечитать сектор. Если и это не поможет (а оно не поможет, так как контрольная сумма заведомо неверна), то он, используя избыточность кода, попытается скорректировать ошибку, и если это не получится — винт выдаст ошибку внешнему устройству. Со стороны операционной системы это будет выглядеть как BAD. Некоторые винты имели повышенную склонность к образованию софт-бэдов из-за ошибок в микропрограмме — при определенных условиях контрольные суммы вычислялись неправильно; у других это происходило из-за дефектов механики. Например, у IBM DTLA периодически нарушался контакт между платой и гермоблоком, что приводило к пропаданию питания гермоблока в самое неподходящее время, в том числе и при записи.

Операционная система или BIOS не могут исправить логический дефект самостоятельно, так как прежде чем писать в сектор, они проверяют его на целостность, нарываются на ошибку и отказываются писать. При этом контроллер винта эту ошибку скорректировать тоже не может: он тщетно пытается прочитать этот сектор со второй, с третьей попытки, и когда это не получается — он всеми силами пытается себе помочь, на ходу подстраивая канал чтения и сервосистему. При этом и раздается тот самый душераздирающий скрежет, так хорошо знакомый владельцам бэдастых «дятлов». Этот скрип производят не «головки по поверхности», как многие привыкли думать, а всего лишь катушка позиционера, из-за специфической формы тока, протекающего через нее, и он абсолютно безопасен. Адрес непрочитанного сектора попадает во временный дефект-лист, изменяя значение атрибута Current Pending Sector в SMART, и сохраняется в нем. Ремапа при чтении не происходит.

И только принудительная низкоуровневая перезапись этого сектора специальной программой в обход BIOS приводит к автоматическому перерасчету и перезаписи контрольной суммы, т.е. бэд бесследно исчезает. Переписать его можно дисковым редактором, способным работать с винтом непосредственно через порты, но обычно «переписывают» весь диск, заполняя его секторы нулями. Утилиты, делающие это, свободно распространяются производителями хардов, и часто неправильно называются «программами для низкоуровневого форматирования». На самом деле это — простые «обнулители», что нисколько не мешает им избавлять винт от бэдов: при удачной записи софт-бэды исчезают, а при неудачной — бэд считается физическим, и происходит авторемап.

Неисправимые логические ошибки
. Это ошибки внутреннего формата винчестера, приводящие к такому же эффекту, как и дефекты поверхности. Возникают при разрушении заголовков секторов, например из-за действия на винт сильного магнитного поля. Но в отличие от физических дефектов, они поддаются исправлению программным путем. А неисправимыми они названы только потому, что для их исправления необходимо сделать «правильное» низкоуровневое форматирование, что обычным пользователям затруднительно из-за отсутствия специализированных утилит. Поэтому в быту такой сектор отключается так же, как и физический — с помощью ремапа. В настоящее время все большее количество винтов выпускается по технологии ID-less (сектора без заголовков), поэтому скоро этот вид ошибок станет неактуальным.

«Адаптивные» бэды
. Несмотря на то, что винты является очень точными устройствами, при их массовом производстве неизбежно возникает разброс параметров механики, радиодеталей, магнитных покрытий и головок. Старым накопителям это не мешало, но у современных винтов с их огромной плотностью записи, малейшие отклонения в размерах деталей или в амплитудах сигналов, могут привести к ухудшению свойств изделия, появлению ошибок, вплоть до полной потери его работоспособности. Поэтому все современные винты при изготовлении проходят индивидуальную настройку, в процессе которой подбираются такие параметры электрических сигналов, при которых устройству работается лучше. Эта настройка осуществляется программой ПЗУ при технологическом сканировании поверхности. При этом генерируются так называемые адаптивы — переменные, в которых содержится информация об особенностях конкретного гермоблока. Адаптивы сохраняются на блинах в служебной зоне, а иногда во Flash-памяти на плате контроллера.

Если в процессе эксплуатации винта адаптивы окажутся разрушены (это может случиться в результате ошибок в самом винте, статического электричества или из-за некачественного питания), то последствия могут быть непредсказуемы: от банальной кучи бэдов до полной неработоспособности девайса, с отказом выходить на готовность по интерфейсу. «Адаптивные» бэды отличаются от обычных тем, что они «плавающие»: сегодня они есть, а завтра могут исчезнуть и появиться совсем в другом месте. Ремапить такой винт бесполезно — дефекты-призраки будут появляться снова и снова. И при этом дисковая поверхность может быть в безупречном состоянии! Лечатся адаптивные бэды прогоном selfscan»а — внутренней программы тестирования, аналогичной той, что применяется на заводе при изготовлении винтов. При этом создаются новые адаптивы, и винт возвращается к нормальному состоянию. Это делается в условиях фирменных сервис-центров.

Намечающиеся дефекты

Это участки поверхности, на которых еще не сформировался явно выраженный дефект, но уже заметны проблемы со скоростью чтения. Это происходит от того, что сектор не читается контроллером с первого раза, и винт вынужден делать несколько оборотов диска, пытаясь прочитать его без ошибок. Если прочитать данные все-таки удается, то винт ничего не сообщит операционной системе, и ошибка останется незамеченной до тех пор, пока на этом месте не возникнет настоящий BAD-блок. Как правило, тут же выясняется, что именно на этом месте хранился очень важный файл, в единственном экземпляре, и спасти его уже нельзя. Поэтому диски нужно периодически тестировать. Это можно делать программой Scandisk или Norton Disk Doctor в режиме тестирования поверхности, но лучше — специальной утилитой, работающей независимо от файловой системы и умеющей выявлять намечающиеся BAD»ы, замеряя время чтения каждого сектора.

О практике работы с секторами рассказано .

Запускаем нашу программу и видим следующее окно:

Выбираем в меню «regeneration» (восстановление) пункт «start process under windows» (запустить процесс из под windows). Чтобы приступить к сканированию сбойных секторов или бэд блоков нам надо сначала «объяснить» программе, что конкретно мы хотим делать.

В следующем окне нам надо выбрать винчестер для сканирования. В нашем случае он — один, выделяем его и нажимаем надпись «start process».

Продолжаем. В следующем окне нас попросят указать вариант сканирования диска. Советую сразу выбрать первый вариант «scan and repair» (сканировать и восстанавливать). Просто вводим с клавиатуры цифру «1», как показано на скриншоте.

И в последнем окне перед самим сканированием сбойных секторов нас «спрашивают» с какого сектора на начать сканирование? Советую оставить цифру «0». Это обеспечит сканирование диска полностью.

Нажимаем клавишу «Enter» и запускаем сканирование на бэд блоки. Мы рассмотрим весь процесс на примере диска, который содержит сбойные сектора. Обратите внимание на скриншот ниже, на нем мы видим прогресс сканирования (белая полоса) и на ней — три, найденные программой, сбойных сектора.

Разберем этот скриншот подробнее: справа вверху мы видим прошедшее с момента запуска сканирования бэд блоков время и время, оставшееся до завершения процесса. При обнаружении сбойных секторов на диске, программа помечает их английской буквой «B» и тут же пытается «вылечить». Если это ей удается, то на месте буквы «В» появляется буква «R», которая говорит об успешном «восстановлении» бэд блока. В левом нижнем углу мы видим статистику по просканированным мегабайтам, а также количество найденных «В» и «вылеченных» «R» сбойных секторов.

По завершению сканирования мы увидим вот такое окно:

Здесь обозначены найденные программой три сбойных сектора и справа — уже знакомую нам статистику, в которой говорится, что все найденные бэд блоки устранены.

Также учтите то обстоятельство, что при обнаружении сбойных секторов весьма желательно (сразу же или — по прошествии нескольких дней) запустить процедуру проверки повторно. Дело в том, что (при серьезном дефекте диска) бэд блоки могут появляться повторно и их количество может только увеличиваться.

Именно об этом и «говорят» нам следующие надписи на скриншоте выше: «4 new bad sectors appear» и «18 bad sectors appear» это — вновь появившиеся на жестком диске сбойные области, обнаруженные при повторном сканировании. Такой диск еще может весьма успешно использоваться некоторое время в качестве дополнительного и на нем можно хранить различную (не очень нужную) информацию и временные файлы. Но вот как надежный носитель информации или — системный диск он не подходит нам однозначно!

Собственно, весь нехитрый процесс тестирования я Вас описал:) Саму логику того, что происходит «за кадром» работы любой программы для восстановления сбойных секторов мы с Вами разбирали в предыдущей статье, которая называется » «.

В дополнение к сказанному, я бы хотел отметить еще одну очень полезную функцию программы «HDD Regenerator». Она может записывать свой загрузочный образ на компакт диск.

Зачем это нужно? Представьте себе ситуацию: у Вас проблемы с жестким диском (не дай бог!:)) и операционная система из за этого просто не загружается. Как мы запустим нашу программу, чтобы она сканировала сбойные сектора винчестера? В этом случае нам на помощь приходит функция создания загрузочной версии программы.

Давайте разберем эту возможность. В самом начале после запуска программы в меню «regeneration» выбираем пункт «create bootable CD/DVD» (создать загрузочный CD или DVD диск).

В следующем окне выбираем наше записывающее устройство, установленное в системе.

Нажимаем кнопку «OK», вставляем чистый диск в устройство и переходим в последнее окно непосредственно перед записью диска. Здесь нам предлагают выбрать скорость записи. Выбираем и нажимаем кнопку «Burn CD» (записать CD).

После окончания записи берем наш (теперь уже загрузочный диск) с программой «HDD Regrenerator», вставляем его в компьютер, на котором мы хотим провести проверку на сбойные сектора. Выставляем на нем загрузку с CD и видим меню, в котором программа показывает нам найденные ей жесткие диски компьютера.

Как видите, у нас их — два. Выбираем (к примеру) второй (вводим с клавиатуры цифру «2») и нажимаем «enter». Далее видим следующее окно.

В нем есть несколько вариантов сканирования винчестера на сбойные сектора:

  1. Сканировать, но не исправлять найденные бэд блоки
  2. Сканировать с исправлением таких секторов
  3. Просмотреть информацию о самой программе

Вводим с клавиатуры цифру «2» (выбираем второй вариант). Видим вот такое окно.

Здесь указываем, что сканировать будем сразу с восстановлением бэд секторов. Нажимаем цифру «1», потом — «enter» и дальше запустится уже знакомый нам процесс тестирования.

Также имейте в виду следующий момент: не качественное электропитание (сбои, вызванные ) или использование различных переходников могут быть причиной того, что программа восстановления будет сигнализировать об обнаружении большого количества сбойных секторов.

Были в моей практике такие случаи. Жесткий диск SATA был подключен через переходник «molex to sata»:

Программа диагностики находила на нем массу бэд блоков, но как только мы поставили соответствующий (у которого присутствовали разъемы питания Sata), проблема исчезла. Так что крепко запомните, — любые переходники это — вынужденное зло и если без них можно обойтись, — избавляйтесь от них немедленно!

Вот и все, что я хотел рассказать Вам сегодня о том, как искать и устранять сбойные сектора на диске. В завершении статьи, как и договаривались, даю ссылку на саму программу « ». Скачивайте, пользуйтесь.

Техническое обслуживание средств вычислительной техники Учебно-методическое пособие

3.1.6. Особенности конструкции современных НЖМД, виды дефектов магнитного диска НЖМД

Современный накопитель на жестких магнитных дисках (НЖМД) представляет собой сложное электронно-механическое устройство. Элементы накопителя размещены на электронной плате и гермоблоке (см. Рисунок36). Основным элементом, размещенным на электронной плате является микроконтроллер (специализированная микроЭВМ), который управляет работой всех устройств накопителя и организует связь с ЦП. Все данные подлежащие хранению размещаются на магнитном диске, который имеет следующую логическую организацию (см. рис 37 ):

Рисунок 37 – Структурная схема НЖМД

Рисунок 38 – Схема размещения данных на диске

Служебная информация

Служебная информация необходима для функционирования самого НЖМД и скрыта от пользователя. Служебную информацию можно разделить на четыре основных типа:

серво-информацию, или серворазметку;

формат нижнего уровня;

91

Техническое обслуживание средств вычислительной техники Учебно-методическое пособие

резидентные микропрограммы (рабочие программы);

таблицы конфигурации и настройки

таблицы дефектов.

Серворазметка необходима для работы сервосистемы привода магнитных

головок НЖМД. Именно по серворазметке осуществляется их позиционирование и удержание на дорожке. Сервисная разметка записывается на диск в процессе производства через специальные технологические окна в корпусе собранного гермоблока. Запись осуществляется собственными головками накопителя при помощи специального высокоточного прибора — серворайтера. Перемещение позиционера головок осуществляется специальным толкателем серворайтера по калиброванным шагам, которые намного меньше межтрековых интервалов.

Рабочие программы (микрокод) управляющего микроконтроллера представляют собой набор программ, необходимых для работы НЖМД. К ним относятся программы первоначальной диагностики, управления вращением двигателя, позиционирования головок, обмена информацией с дисковым контроллером, буферным ОЗУ и т.д.

Производители жестких дисков размещают часть микропрограмм на магнитном носителе не только для экономии объема ПЗУ, но и для возможной оперативной коррекции кода, если в процессе производства или эксплуатации обнаруживаются ошибки. Переписать микропрограмму на диске значительно проще, чем перепаивать «прошитые» микроконтроллеры.

Таблицы конфигурации и настройки накопителей содержат информацию о логической и физической организации дискового пространства. Они необходимы для самонастройки электронной части диска, которая одинакова для всех моделей семейства.

Таблицы дефектов. (дефект-лист) содержит информацию о выявленных дефектных секторах

Современные винчестеры имеют как правило два основных дефект-листа:

Первый P-list(«Primary»-первичный) заполняется на заводе при изготовлении накопителя;

Второй G-list («Grown» — растущий), и пополняется в процессе эксплуатации винта, при появлении новых дефектов.

Кроме того, некоторые НЖМД имеют еще

лист серво-дефектов (сервометки, наносимые на пластины винчестеров, тоже иногда имеют ошибки),

список временных (pending) дефектов. В него контроллер заносит

«подозрительные» с его точки зрения секторы, например те, что прочитались не с первого раза, или с ошибками.

Технология изготовления магнитных дисков очень сложная, контроль

состояния поверхности диска осуществляется на всех этапах изготовления, но даже это не позволяет получить поверхность магнитного диска без дефектов. В ходе эксплуатации диска количество дефектов возрастает. Поэтому производители накопителей предусмотрели специальные методы скрытия

92

Техническое обслуживание средств вычислительной техники Учебно-методическое пособие

дефектов, которые позволяют скрыть дефекты как при производстве так и при эксплуатации.

Методы скрытия дефектных секторов (при производстве дисков). В

наспоящее время припроизводстве дисков используется несколько основных методов скрытия дефектов.

Первый заключается в переназначении адреса испорченных секторов в на адрес резервного сектора (Рисунок 38).

Метод вызывает потерю производительности НЖМД, так как он, каждый раз обнаруживая сектор, помеченный как негодный, будет вынужден перемещать головки в резервную область, которая может находиться далеко от места дефекта.

Такой метод скрытия дефектов получил название «метод замещения» или ремап (от английского «re-map»: перестройка карты секторов). В настоящее время при производстве не применяется.

Рисунок 39 — Методы переназначения сектора

Второй (основной) способ использует следующий алгоритм: после выявления всех дефектов, адреса всех исправных секторов переписываются заново, так, чтобы их номера шли по порядку. Плохие сектора просто игнорируются и в дальнейшей работе не участвуют. Резервная область также остается непрерывной и ее часть присоединяется к концу рабочей области — для выравнивания объема. Этот, второй основной тип скрытия дефектов получил название «метод пропуска сектора». Новый диск не имеет Bad-секторов, а

резервная область непрерывна!

Рисунок 40 — Метод пропущенного сектора

Методы скрытия дефектных секторов при эксплуатации дисков Для скрытия дефектов в бытовых условиях применяется «метод

замещения» Ремап Замещение выполняется в автоматическом режиме эта технология получила

название automatic defect reassignment (автоматическое переназначение дефектов), а сам процесс — reassign.

Работает ремап следующим образом:

если при попытке обращения к сектору происходит ошибка, контроллер понимает, что данный сектор неисправен, и «на лету» помечает его как BAD.

Его адрес тут же заносится в таблицу дефектов (G-list).

93

Техническое обслуживание средств вычислительной техники Учебно-методическое пособие

Во время работы контроллер постоянно сравнивает текущие адреса секторов с адресами из таблицы и не обращается к дефектным секторам. Вместо этого он переводит головки в резервную область и читает сектор оттуда. На характеристике диска Vчтения=F(Nдор), как небольшие провалы на графике чтения. Тоже самое будет и при записи.

Система оперативного наблюдения за состоянием HDD — S.M.A.R.T.

Почти все винчестеры, выпущенные после 95-го года, имеют систему оперативного наблюдения за своим состоянием — S.M.A.R.T. (Self Monitoring And Reporting Technology).

Между атрибутами SMART и состоянием поверхности существует некоторая взаимосвязь. Некоторые имеют прямое отношение к bad-блокам:

Reallocated sector count и Reallocated event count: число переназначенных секторов. Эти атрибуты показывают количество секторов, переназначенных ремапом в G-list дефект-лист. У новых винтов они обязательно должны быть равны нулю! Если их значение отличается от нуля, то это означает, что винт уже был в употреблении.

Raw read error rate: количество ошибок чтения. Это «мягкие» ошибки, успешно скорректированные электроникой накопителя и не приводящие к искажению данных. Опасно, когда этот параметр резко снижается за короткий срок, переходя в желтую зону. Это говорит о серьезных проблемах в накопителе.

Current Pending Sector: этот атрибут отражает содержимое «временного» дефект-листа, присутствующего на всех современных накопителях, т.е. текущее количество нестабильных секторов. Эти секторы винт не смог прочесть с первого раза. Постоянное значение этого атрибута выше нуля говорит о неполадках в накопителе.

Uncorrectable Sector: показывает количество секторов, ошибки в которых не удалось скорректировать ECC-кодом. Если его значение выше нуля, это означает, что винту пора делать ремап.

Виды дефектов магнитного диска НЖМД

Дефекты поверхности НЖМД делятся на следующие группы:

1.Физические дефекты, которые подразделяются на: Дефекты поверхности.

Серво-ошибки Аппаратные BAD’ы.

2.Логические дефекты, которые подразделяются на: Исправимые логические дефекты (софт-бэды) Неисправимые логические ошибки.

«Адаптивные» бэды.

Дефекты поверхности. Возникают при механическом повреждении магнитного покрытия внутри пространства сектора, например из-за царапин, вызванных пылью, старением блинов или небрежным обращением с винтом. Такой сектор должен быть помечен как негодный и исключен из обращения.

94

Техническое обслуживание средств вычислительной техники Учебно-методическое пособие

Серво-ошибки. По сервометкам происходит стабилизация скорости вращения двигателя и удержание головки на заданном треке, независимо от внешних воздействий и тепловой деформации элементов.

Однако в процессе эксплуатации диска, некоторые сервометки могут оказаться разрушены. Если плохих сервометок станет слишком много, в этом месте начнут происходить сбои при обращении к информационной дорожке: головка, вместо того, чтобы занять нужное ей положение и прочитать данные, начнет шарахаться из стороны в сторону. Наличие таких ошибок часто сопровождается стуком головок, зависанием накопителя и невозможностью исправить его обычными утилитами. Устранение таких дефектов возможно только специальными программами, путем отключения дефектных дорожек, а иногда и всей дисковой поверхности.

Самостоятельно НDD восстановить сервоформат не может, это делается только на заводе.

Аппаратные BAD’ы. Возникают из-за неисправности механики или электроники накопителя. К таким неполадкам относятся:

обрыв головок;

смещение дисков;

погнутый вал в результате удара;

запыление гермозоны;

различные «глюки» в работе электроники.

Ошибки такого типа обычно имеют катастрофический характер и не подлежат исправлению программным путем.

Исправимые логические дефекты (софт-бэды): появляются, если контрольная сумма сектора не совпадает с контрольной суммой записанных в него данных.

Возникает из-за помех или отключения питания во время записи, когда HDD уже записал в сектор данные, а контрольную сумму записать не успел.

При последующем чтении такого «недописанного» сектора произойдет сбой: винт сначала прочитает поле данных, потом вычислит их контрольную сумму и сравнит полученное с записанным. Если они не совпадут, контроллер накопителя решит, что произошла ошибка и сделает несколько попыток перечитать сектор. Если и это не поможет (а оно не поможет, так как контрольная сумма заведомо неверна), то он, используя избыточность кода, попытается скорректировать ошибку, и если это не получится — винт выдаст ошибку внешнему устройству. Со стороны операционной системы это будет выглядеть как BAD.

Неисправимые логические ошибки. Это ошибки внутреннего формата винчестера, приводящие к такому же эффекту, как и дефекты поверхности. Возникают при разрушении заголовков секторов, например из-за действия на винт сильного магнитного поля. Но в отличие от физических дефектов, они поддаются исправлению программным путем. А неисправимыми они названы только потому, что для их исправления необходимо сделать «правильное»

95

Техническое обслуживание средств вычислительной техники Учебно-методическое пособие

низкоуровневое форматирование, что обычным пользователям затруднительно изза отсутствия специализированных утилит.

«Адаптивные» бэды. Несмотря на то, что винты является очень точными устройствами, при их массовом производстве неизбежно возникает разброс параметров механики, радиодеталей, магнитных покрытий и головок.

Поэтому все современные винты при изготовлении проходят индивидуальную настройку, в процессе которой подбираются такие параметры электрических сигналов, при которых устройству работается лучше.

Эта настройка осуществляется специальной программой при технологическом сканировании поверхности. При этом генерируются так называемые адаптивы — переменные, в которых содержится информация об особенностях конкретного гермоблока. Адаптивы сохраняются на дисках в служебной зоне, а иногда во Flash-памяти на плате контроллера.

В процессе эксплуатации винта адаптивы могут быть разрушены разрушены

«Адаптивные» бэды отличаются от обычных тем, что они «плавающие». Лечатся адаптивные бэды прогоном selfscan’а — внутренней программы

тестирования, аналогичной той, что применяется на заводе при изготовлении винтов. При этом создаются новые адаптивы, и винт возвращается к нормальному состоянию. Это делается в условиях фирменных сервис-центров.

96

Техническое обслуживание средств вычислительной техники Учебно-методическое пособие

3.1.7. Неисправности аппаратной части НЖМД их характер проявления, методика их устранения

Типовые причины возникновения неисправностей аппаратной части НЖМД можно условно разделить на следующие группы:

Неисправности из-за естественного старения НЖМД;

Неисправности, обусловленные неверным режимом эксплуатации;

Неисправности, связанные с ошибками в конструкции.

Неисправности из-за естественного старения НЖМД.

Неисправности из-за естественного старения НЖМД

При правильной эксплуатации с соблюдением всех технических требований

вкачественно изготовленном накопителе наблюдается процесс естественного старения. Сильнее всего ему подвержены магнитные диски.

Во-первых, со временем ослабевает намагниченность минимальных информационных отпечатков, и те участки дисков, которые раньше читались без проблем, начинают считываться не с первого раза или с ошибками.

Во-вторых, происходит старение магнитного слоя дисков.

В-третьих, на пластинах появляются царапины, сколы, трещины и пр. Все это приводит к появлению поврежденных секторов.

Процесс нормального старения дисков достаточно длительный и обычно растягивается на 3…5 лет.

Следует отметить, что для НЖМД наиболее благоприятным является непрерывный режим работы, а не старт/стопный. Поэтому довольно долго служат накопители в постоянно работающих серверах, расположенных в специальном помещении или стойке, где поддерживаются нормальные климатические условия.

Неисправности, обусловленные неверным режимом эксплуатации

Являются наиболее распространенная причина отказов НЖМД к основным разрушающим факторам которого относятся:

перегрев,

ударные нагрузки

скачки напряжения питания.

Важным температурным показателем является скорость изменения температуры, которая не должна превышать 20°С/час в рабочем состоянии и 30°С/час в нерабочем. Превышение скорости разогрева очень опасно для механики накопителей и называется термическим ударом.

Механические воздействия на гермоблок губительны для прецизионных механических частей накопителя. Ударное воздействие на гермоблок вызывает колебания головок, которые производят серию ударов по поверхности дисков, что неизбежно приводит к механическим повреждениям пластин и головок.

Серьезную опасность для электронной части НЖМД может представлять некачественный блок питания персонального компьютера. Напряжения питания должны находиться в пределах +5 В ± 5% и +12 В ± 10% при допустимой амплитуде пульсаций 100 мВ и 200 мВ соответственно.

97

Техническое обслуживание средств вычислительной техники Учебно-методическое пособие

Неисправности, связанные с ошибками в конструкции

В последнее время качество НЖМД снизилось, о чем свидетельствует значительное сокращение гарантийного срока эксплуатации основными производителями.

Плохой контакт в игольчатом разъеме, соединяющем плату электроники и микросхему предусилителя на блоке головок. В результате плохого контакта в разъеме происходит запись неверной информации в технологические байты сектора, например в поле CRC-кода. Этот дефект может привести к повреждению служебной информации, восстановить которую накопитель при следующем включении питания не сможет.

Некачественная пайка микросхем на заводе-изготовителе. Такие дефекты проявляются примерно через год эксплуатации накопителя, когда во время нормальной работы накопитель вдруг выключается и больше не запускается («зависает») либо начинает «стучать» головками, что может привести к повреждению механики и/или служебной информации.

Некачественные микросхемы, которые выходят из строя при длительном нагреве, не превышающем допустимые пределы. Дефект можно исправить заменой микросхемы.

Несовершенная конструкция гидродинамического подшипника, приводящая к возникновению в полости смазки частиц стружки и, как следствие, заклиниванию шпиндельного двигателя.

Некачественное крепление диска на шпинделе, в результате чего биение диска постоянно возрастает и вызывает разрушение подшипника в шпиндельном двигателе; появляется шум при работе накопителя, а через некоторое время — дефектные секторы, поскольку из-за биения диска «дальние» дорожки начинают плохо считываться.

Некачественные микросхемы ЭППЗУ (flash), которые могут потерять хранимую в них микропрограмму вследствие утечки заряда при нагреве. Перезаписать ПЗУ можно на специальном программаторе либо в технологическом режиме работы накопителя.

Ошибки в микропрограмме управления накопителем. Производители накопителей не публикуют информацию о характере ошибок и их последствиях, но обновления микропрограмм выпускают достаточно регулярно.

Симптомы неисправности диска Первая и самая популярная — при подаче питания на диск с ним не

происходит вообще ничего, он полностью молчит и даже не раскручивает шпиндельный двигатель, либо пытается это делать, но не набирает нужные обороты. Подобный симптом может присутствовать оттого, что заклинило сам двигатель, либо головки упали на диск и прилипли к нему (такое бывает практически на всех современных дисках, т.к. головки идеально отполированы и возникает эффект диффузии).

Вторая неисправность — диск нормально раскручивается, но отсутствует распарковка головок — характерный тихий щелчек. Подобное возникает редко, т.к. часто управление позиционированием головок (сервосистема) и трехфазный

98

Техническое обслуживание средств вычислительной техники Учебно-методическое пособие

генератор для шпиндельного двигателя размещены на одном кристалле, и если и выходит из строя, то как правило все сразу или распарковки не происходит потому, что оборвалась катушка позиционирования на блоке головок.

Третья неисправность — диск нормально рекалибруется при включении питания и не издает посторонних звуков, но при этом не определяется в BIOS, а название модели не соответствует тому, которое написано на самом диске, либо в названии присутствуют непонятные символы. В таком случае очень часто бывает неисправен главный интерфейсный чип на плате электроники. Производить запись на такой накопитель категорически не рекомендуется, т.к. в следствие неисправности шины данных можно повредить данные на диске.

Четвертая неисправность — связанная с дефектом микросхем, которые деградируют от постоянных тепловых расширений (температурного градиента). Проявляется неисправность в основном с прогревом, т.е. какое то время диск отлично работает, а затем начинает скрежетать , стучать или останавливать двигатель.

Неисправности аппаратной части НЖМД IDE можно разделить на следующие группы:

неисправность начальной инициализации;

неисправность схемы управления шпиндельным двигателем;

неисправность схемы управления позиционированием;

неисправность канала чтения-преобразования данных;

неисправность канала записи, схемы предкомпенсации данных;

разрушение служебной информации.

Неисправности начальной инициализации приводят, как правило, к

полной неработоспособности накопителя.

В НЖМД с такой неисправностью очень часто даже шпиндельный двигатель не запускается (в следствие того, что управляющий микропроцессор не выдаст разрешение на запуск) или запускается, затем останавливается и снова запускается и т.д., но во всех случаях НЖМД не формирует код 50Н в регистре состояния.

Основные причины, по которым управляющий микропроцессор накопителя не может выполнить начальную инициализацию:

неисправность схемы сброса;

неисправность кварцевого тактового генератора;

разрушение управляющей микропрограммы в памяти программ;

неисправность управляющего микропроцессора;

неисправность однокристального микроконтроллера.

Для локализации неисправности: Необходимо проверить:

питающие напряжения на управляющем микропроцессоре однокристальном микроконтроллере,

возбуждение кварцевого резонатора, подключенного к управляющему микропроцессору, или приход тактовых импульсов если используется внешний генератор,

99

Техническое обслуживание средств вычислительной техники Учебно-методическое пособие

все схемы синхронизации накопителя.

Проверить схему сброса НЖМД.

Для этого замыкают и размыкают контакты 1 и 2 интерфейсного разъема накопителя и осциллографом наблюдают прохождение сигнала «RESET» на управляющий микропроцессор и однокристальный микроконтроллер.

Если на управляющий микропроцессор приходят тактовые импульсы (или возбуждается кварцевый резонатор, подключенный к микропроцессору) и схема сброса работает, то микропроцессор должен отрабатывать управляющую программу, о чем свидетельствуют импульсы на выводах ALE, RD, WR.

Если кварцевый резонатор, подключенный непосредственно к микропроцессору, не возбуждается или отсутствуют импульсы на выводе ALE,то скорее всего неисправен управляющий микропроцессор накопителя.

Рисунок 41 — Типовая принципиальная схема управления шпиндельным двигателем

Неисправность схемы управления шпиндельным двигателем.

Если при включении питания накопителя шпиндельный двигатель не запускается, необходимо убедиться в исправности гермоблока, подключив к нему исправную плату электроники.

Если такой возможности нет, то проверяют сопротивление обмоток (фаз) шпиндельного двигателя, которое должно составлять примерно 2 Ом относительно среднего вывода, а затем переходят к поиску неисправности на плате управления.

Иногда запуск шпиндельного двигателя невозможен из-за прилипания магнитных головок к дискам.

Критериями запуска шпиндельного двигателя являются:

Наличие питающего напряжение на микросхеме управления,

Наличие опорной тактовой частоты

Наличие сигнала разрешения на запуск.

100

Понравилась статья? Поделить с друзьями:
  • Неисправимая ошибка приложения
  • Неисправимая ошибка при установке net framework
  • Неисправимая ошибка пожалуйста перезапустите игру rage mp
  • Неисправимая ошибка пожалуйста перезапустите игру gta 5
  • Неисправимая ошибка пожалуйста перезагрузите игру