URL: https://www.opennet.dev/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID3
Нить номер: 138369
[ Назад ]

Исходное сообщение
"Выпуск CRIU 4.2, системы для сохранения и восстановления состояния процессов в Linux"

Отправлено opennews , 14-Ноя-25 09:28 
После шести месяцев разработки опубликован выпуск инструментария CRIU 4.2 (Checkpoint and Restore In Userspace), предназначенного для сохранения и восстановления процессов в пространстве пользователя. Инструментарий позволяет сохранить состояние одного или группы процессов, а затем возобновить работу с сохранённой позиции, в том числе после перезагрузки системы или на другом сервере без разрыва уже установленных сетевых соединений.  Код проекта написан на языке Си и распространяется под лицензией GPLv2. CRIU применяется в таких системах управления контейнерами, как OpenVZ, LXC/LXD и Docker. Необходимые для работы CRIU изменения включены в основной состав ядра Linux...

Подробнее: https://www.opennet.dev/opennews/art.shtml?num=64248


Содержание

Сообщения в этом обсуждении
"Выпуск CRIU 4.2, системы для сохранения и восстановления сос..."
Отправлено Аноним , 14-Ноя-25 09:28 
Использую в продуктивной системе, здоровья проекту!

"Выпуск CRIU 4.2, системы для сохранения и восстановления сос..."
Отправлено привет , 14-Ноя-25 10:57 
продуктовой (с) тех-лид ВТБ

"Выпуск CRIU 4.2, системы для сохранения и восстановления сос..."
Отправлено Жироватт , 14-Ноя-25 09:50 
Попробовал. Хм...Джава-стек сумело корректно сохранить и восстановить

"Выпуск CRIU 4.2, системы для сохранения и восстановления сос..."
Отправлено Аноним , 14-Ноя-25 09:54 
А чего там восстанавливать? Только с видеокартами были сложности. Лучше расскажи, какое практическое применение есть? Я могу придумать только продолжительный рендер без возможности прервать и срочное обновление.

"Выпуск CRIU 4.2, системы для сохранения и восстановления сос..."
Отправлено Жироватт , 14-Ноя-25 10:29 
На старых версия не всегда корректно работал с большим количеством JNI-вызовов, ведь должны захватываться и они.
> Лучше расскажи, какое практическое применение есть?

Рендер, расчеты.
На билдферме может выполняться сборочный процесс.
Иногда просто нежелательно тушить процесс


"Выпуск CRIU 4.2, системы для сохранения и восстановления сос..."
Отправлено Шарп , 14-Ноя-25 09:54 
>без разрыва уже установленных сетевых соединений

Это невозможно. Другая сторона в сетевом соединении увидит разрыв. Если есть данные прикреплённые к сессии, то они сбросятся.


"Выпуск CRIU 4.2, системы для сохранения и восстановления сос..."
Отправлено Аноним , 14-Ноя-25 10:18 
Другая сторона только отвалится по таймауту. Если не успеет, то всё будет как будто у нас тут небольшой свопинг приключился.

"Выпуск CRIU 4.2, системы для сохранения и восстановления сос..."
Отправлено Аноним , 14-Ноя-25 10:33 
Там специальные подпорки в ядре, позволяющие реконструировать внутреннее состояние сокета без использования вызовов сокетного апи, поэтому сокет будет восстановлен точно в том же состоянии, и если удалённая сторона не затаймаутилась - то она ничего не заметит, закрытия сокета и посылки FIN не происходит, а после разморозки трафик едет дальше, как ни в чём не бывало.

"Выпуск CRIU 4.2, системы для сохранения и восстановления сос..."
Отправлено Аноним , 14-Ноя-25 12:16 
> после разморозки трафик едет дальше, как ни в чём не бывало.

даже через неделю?


"Выпуск CRIU 4.2, системы для сохранения и восстановления сос..."
Отправлено trolleybus , 14-Ноя-25 09:59 
> Устранено целочисленное переполнение в функции pagemap_len()

А вот это типично сишная проблема. Многие тупо не парятся и везде пишут int, когда даже стандартом не определено, сколько точно байтофф оно занимает, ибо architecture dependent. Про знаковые/беззнаковые вообще молчу. А использовать всякие uint32_t не хотим, это ненужное ненужно.

Даже в расте такой номер не пройдет, если только специально не поиздеваться.


"Выпуск CRIU 4.2, системы для сохранения и восстановления сос..."
Отправлено Пыщь , 14-Ноя-25 10:32 
Понравилась цитата защищавшего расто-операторов, суну сюда: "Это вы себе что-то придумывете. А люди обучаются, исправляют ошибки, получают знания и удовольствие."

"Выпуск CRIU 4.2, системы для сохранения и восстановления сос..."
Отправлено Медведь , 14-Ноя-25 11:43 
> А вот это типично сишная проблема.

Бред сивой кобылы. Такое возможно в любом  ЯП, где целые занимают фиксированный размер в памяти. Ржа тоже вполне себе подвержена ошибкам из-за выхода за допустимый диапазон значений.

Забавно, ржавозависимые при каждом баге в растокоде упрекают всех, что от их драгоценной ржи требуют чего-то, чего ржа не обещала, но сами не могут определиться с тем, чего же она все-таки обещала ;)


"Выпуск CRIU 4.2, системы для сохранения и восстановления сос..."
Отправлено Catwoolfii , 14-Ноя-25 12:00 
эту штуку могли бы использовать в proxmox для живой миграции контейнеров lxc