The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



Вариант для распечатки  
Пред. тема | След. тема 
Форум Открытые системы на рабочей станции (Драйверы, оборудование)
Режим отображения отдельной подветви беседы [ Отслеживать ]

Оглавление

Пару недель назад в 20 раз упала скорость работы диска WD SATA., Аноним (0), 20-Апр-23, (0) [смотреть все]

Сообщения [Сортировка по времени | RSS]


7. "Пару недель назад в 20 раз упала скорость работы диска WD SATA."  +/
Сообщение от Аноним (8), 21-Апр-23, 20:46 
Этот диск черепичный (я модель не гуглил)? Черепичные - эпическая подстава с просадкой по скорости.

> Пробег - 48637 часа

5 лет и полгода. Это много.

> Ошибок чтения - 2 обе на 42234 часу работы

Могло питание взглюкнуть в тот день. А может и правда что-то было в диске.

> smartctl -a /dev/sda
> тесты проходит без ошибок

Тесты - это что сейчас.

Ещё важна талица и разбор параметров. Вних что было раньше, какого именно рода были ошибки. Было reallocated sectors на запасные, например. Какая частота "штатных" corrections на лету. Перебрать все параметры из таблицы с документацией и поисковиком на перевес.


> dd if=/dev/urandom of=/dev/sda bs=1M status=progress

Размер 2M, вроде, оптимальнее по скорости. Но зависит, надо пробовать...

Т.к. не интересуют задержки от прочего железа из-за генерации рандомных данных (это замедляет), то лучше


sudo dd if=/dev/zero of=/dev/sda bs=2M

а из соседнего терминала постреливать (в Linux варианте dd)


sudo killall -USR1 dd

Или status=progress

После 50% механич. диска скорость заметно падает. Это норма. К концу диска в норме до 50% (в 0.5 раза), насколько помню прошлое эникея. Это, конечно, никак не в 20 раз.

> работы диска нет. Есть мнение, что горение лампочки и тихая работа
> диска свидетельствуют о проблеме в механики - выходит из строя мотор
> вращающий блины.

Кроме мотора есть ещё привод головок - тоже механика.

Стрёкот создаёт метание головок между позициями на пластинах. А здесь идёт последовательная запись блок за соседним блоком без метания в разные места. Т.к. пишет простую реку данных в сектора подряд. Когда на диске файловая система и зпись в файлы, то пишет только на своб. место, раскиданное произвольно по диску и это метание слышно. Потому и тихо, что от dd льёт в сектора тупо по порядку номеров.

> Вирус вредит или диск дохнет?

Кабель данных, кабель питания, проблемы по мат.плате по питанию, сам блок питания Ок? Напряжения всюду на всех режимах больше 3.3В, 5.0В, больше 12.0 Volt??? Если меньше номинала на 0.3В, то повод задуматься, но ещё будет хватать. Если меньше номиналов на 0.5В, то паралельно проверить любого рода проблемы по питанию во всех компонентах (0.5 - это уже большое отклонение, ненорма).

Кабели данных нередко кучей есть новые...

Признаков вирусов тут точно нет. И в прошивку они точно не влезут.

5,5 лет - много для диска десктопа. Неповезло именно с этим или питанием/кабелями, скорее всего. Нужно разбираться с аппаратными параметрами. Не забывая про контроллеры на мат.плате (это они подключены к диску и тоже могут выбирать скорость).

Ответить | Правка | Наверх | Cообщить модератору

12. "Пару недель назад в 20 раз упала скорость работы диска WD SATA."  +/
Сообщение от Аноним (12), 22-Апр-23, 08:37 
>> Ошибок чтения - 2 обе на 42234 часу работы
> Могло питание взглюкнуть в тот день. А может и правда что-то было в диске.
> Ещё важна талица и разбор параметров. Вних что было раньше, какого именно  рода были ошибки. Было reallocated sectors на запасные, например. Какая частота  "штатных" corrections на лету. Перебрать все параметры из таблицы с документацией и поисковиком на перевес.

В логах этих ошибок написано что диск находится в "неизвестном состоянии" сама ошибка "READ DMA" есть дамп регистров после ошибок и дамп команд до ошибки. Во время самой ошибки состояние неизвестно. Эти ошибки случились больше года назад.

Есть в логах макс температура 87C при макс допустимой только 70С даты события нет.
Есть сообщение что в прошлом был зафиксирован сбой в датчике температуры воздуха между блинами диска, даты нет.

Другие ошибки по нулям. Все перфейл ошибки по нулям.


>> Есть мнение, что горение лампочки и тихая работа диска свидетельствуют о проблеме в механики - выходит из строя мотор вращающий блины.
> Кроме мотора есть ещё привод головок - тоже механика.
> Стрёкот создаёт метание головок между позициями на пластинах.

Стрекота нет! Работа диска СЛИШКОМ ТИХАЯ, лампочка горит, IO 100%, все подвисает, а записи реальной на диск нет, как будто пишет скачками, с задержками 1-2 минуты. Особо проявляется в dd и sync. Какой то ядерный процес [jbd2/dm-3-8] при sync жрёт IO.

Мне сказали что умерает механика, а именно мотор вращающий блины, не хватает ему мощи разогнать блины, электроника диагностирует недостаточную скорость вращения блинов для записи, блокирует запись, пытается откалибровать скорость вращения, увеличить её разгоняя блины, по этому и притормаживает всё на запись. Но это все не точно.

>> Вирус вредит или диск дохнет?
> Кабель данных, кабель питания,

Нормальные.

> проблемы по мат.плате по питанию, сам блок питания Ок? Напряжения всюду на всех режимах больше 3.3В, 5.0В, больше 12.0 Volt??? Если меньше номинала на 0.3В, то повод задуматься, но ещё будет хватать. Если меньше номиналов на 0.5В, то паралельно проверить любого рода проблемы по питанию во всех компонентах (0.5 - это уже большое отклонение, ненорма).

Не проверял тестером. Возможно мало вольтажа для мотора и он не выдает нужную мощность.

Ни настройки железа, ни сама OS не изменялись. Упала в 29 раз скорость записи на диск.

> Признаков вирусов тут точно нет. И в прошивку они точно не влезут.

Ошибок нет. А скорость записи упала в 20раз. Провел > 10 тестов. Результаты повторяемые. Если бы вольтаж прыгал, то иногда скорость записи подымалась бы до нормы.

AIDE зафиксировала изменение прав на /dev/console с 600 на 622 !

Вирь, буткит, в прошивке диска очень вероятен. Он и тормозит регуларно.

В логах ядра появились редкие (раз в несколько дней), но регулярные записи:


kernel: INFO: task jbd2/dn-3-8:68496 blocked for more then 120 seconds.
длинный трейс ведра...

есть трейсы и от других процесов, даже обычных пользовательских на чтение диска.

Буткит в прошивке диска или мамки очень вероятен.

Ответить | Правка | Наверх | Cообщить модератору

13. "Пару недель назад в 20 раз упала скорость работы диска WD SATA."  +/
Сообщение от Аноним (15), 22-Апр-23, 13:58 
У меня cбой/заражение диска сопровождается в логах этими симптомами:
https://access.redhat.com/solutions/408833
https://access.redhat.com/solutions/4319241
https://support.oracle.com/knowledge/More%20Application...

INFO: task jbd2/dm-47-8:6937 blocked for more than 120 seconds.
"echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
jbd2/dm-47-8  D 000000000000000b     0  6937      2 0x00000080
ffff8a1fd1363d20 0000000000000046 0000000000016700 0000000000016700
ffff8a1fd34bd800 0000000000016700 0000000000016700 ffff8a1fd0493540
ffff8a1fd0493af8 ffff8a1fd1363fd8 000000000000fb88 ffff8a1fd0493af8
Call Trace:
[<ffffffff81096f8e>] ? prepare_to_wait+0x4e/0x80
[<ffffffffa025a7cf>] jbd2_journal_commit_transaction+0x19f/0x14b0 [jbd2]
[<ffffffff810096f0>] ? __switch_to+0xd0/0x320
[<ffffffff8105e759>] ? find_busiest_queue+0x69/0x150
[<ffffffff81080fcc>] ? lock_timer_base+0x3c/0x70
[<ffffffff81096ca0>] ? autoremove_wake_function+0x0/0x40
[<ffffffffa0260f38>] kjournald2+0xb8/0x220 [jbd2]
[<ffffffff81096ca0>] ? autoremove_wake_function+0x0/0x40
[<ffffffffa0260e80>] ? kjournald2+0x0/0x220 [jbd2]
[<ffffffff81096936>] kthread+0x96/0xa0
[<ffffffff8100c0ca>] child_rip+0xa/0x20
[<ffffffff810968a0>] ? kthread+0x0/0xa0
[<ffffffff8100c0c0>] ? child_rip+0x0/0x20
Kernel panic - not syncing: hung_task: blocked tasks

Чуть другое в трейсе, но ошибка точно эта:

INFO: task jbd2/dm-3-8:245647 blocked for more than 120 seconds.

Ядро едет дальше и все работает. Какая у меня нагрузка на рабочью станцию? Наверно мало для clamd RAM, а баз много. Вот во врема обновления баз clamd и чуть грузит систему.
Ответить | Правка | Наверх | Cообщить модератору

14. "Пару недель назад в 20 раз упала скорость работы диска WD SATA."  +/
Сообщение от Аноним (15), 22-Апр-23, 14:15 
На этот лог наверно обращать внимания не надо, это симптомы, болезни.
irqbalance запущен.

Проблема таки аппаратна в диске, при записи/считывании обновлённых баз clamd подвешивает систему из-за 100% загрузки IO диска. Рашать надо проблему с диском.

Ответить | Правка | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру