> На практике btrfs при таком обычно орет "csum error" в логи и
> если юзерь не совсем баклан... из того что на виду, отловился
> глючный проц и пару плашек оперативки как раз. Неплохой валидатор работы
> оборудования получился.Эмм, в оперативную память кладут и другие вещи, помимо данных для btrfs scrub. И они побьются заодно. Только контрольной суммы у них не будет. Но перед записью на диск появится, подсчитанная от уже побитых данных. Случай с глючной оперативкой (которую можно выявить и иначе) достаточно очевиден, а халат нужен в разговоре про космически-лучевые soft error'ы.
> Это может себе вообразить только тот кто никогда не интересовался как это
> работает и видимо не имеет особого опыта эксплуатации компьютерных систем.
Поведай, зачем тогда изобрели RAID-массивы. В них (без доп. data checksumming'а) не было бы смысла, если бы диск обычно умирал "тихо". Хотя и так ясно, что изобретатели не интересовались, как это работает и не имели особого опыта.
На этом держатся все системы без контрольных сумм для данных (без T10-PI, ZFS, btrfs, ReFS, dm-integrity што там ещё).
Слова я выбирал, категоричности избегал, дальше мысль раскрыл, исключения описал.
> Хлам типа EXT4 вместо этого скорее сбойный сектор будет до упора насиловать
Но что сможет сделать btrfs без избыточности? ext4-без-массива-под-ней здесь всё-таки как соломенное чучело для спора.
> Если вместо того чтобы умничать на форумах сходить качнуть лекции CS
Можно и патенты Hynix с его miscorrection metric'ами и miscorrection threshold'ами. Перестараться - это, наверное, некорректное упрощение, но всё-таки у SSD есть возможности следить за своим здоровьем, свалиться в fail-safe пораньше.
> Я пару раз даже на HDD такое видел
Вот это интересно. А про SSD - в ресурсном тесте 3dnews вроде три экземпляра умирали подобным образом и это разочаровывает, исход с тихим повреждением не должен становиться нормой.
> На самом деле для небольших инсталяхах IMHO RAID5 можно и попытаться. Но только понимая ограничения этого всего.
Мой посыл был только на тему халатов.
В 2007 появилась нашумевшая статья* о том, что RAID5 через два года придёт конец из-за URE=10^-14. Остальные риски для автора не имели значения. Не важно, умрёт ли диск во время ребилда, когда даже обычный исправный диск нельзя прочитать без нескольких неисправимых ошибок (бэд-блоков). И эти мысли укоренились. Говаривали даже, что RAID0 надёжнее RAID5 - математически доказано - всё равно во время ребилда** ошибки похоронят массив на ~10+ ТБ, а дисков в RAID0 меньше.
Получилось интересное помешательство. Часть людей поверила в рассказ про RAID5 и URE, не задумываясь о том, что реальный URE гораздо ниже. Не задумываясь, что каждый первый scrub якобы должен исправлять по ошибке на дисках типа Toshiba N300 16TB. Что без избыточности (RAID/DUP) такие диски должны быть не бесполезны, а даже опасны. Что их SMART должен плодоносить ошибками.
* https://www.zdnet.com/article/why-raid-5-stops-working-in-2009/
** В остальное время бэд-блоки спят. Автор не учёл, что по его теории во время обычной работы должно происходить постоянное исправление бэдов, невозможное в RAID0.
> Ну как бы если кому плевать на свои данные я так то
> не против, но когда они при этом начинают высовываться и что-то
> про (не)надежность ФС лечить - это не находит моего понимания.
Говоришь как тот адепт ZFS. Ветка почти началась с коммента про скорость (второй в ветке, не мой). Дальше говорил о цене фич, о пофайловом сжатии и снапшотах, которые бы добавлялись без компромиссов ("Парето-оптимально"), о шифровании, о чексуммах-для-данных-на-уровне-ФС как приятном бонусе.
> > Не находил упоминаний такого софта/железа, которое бы занималось сверкой зеркал/чётности
> > при чтении (а не только при ручном запуске проверки).
> Ну а вот BTRFS заметив сбой чексумы...
Ну так не спорю. Только подтверждаю, что не видел такого.
> > Есть dm-dust (бэды, исправляемые перезаписью) и есть error (неисправляемые?),
> > zero (использовать как мгновенное тихое повреждение?) в таблице в dmsetup.
> И пусть себе есть. Где-то там.
Это полезные этажерки, не обижай их. Это эмуляторы особо мерзеньких девайсов.