URL: https://www.opennet.dev/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID3
Нить номер: 130297
[ Назад ]

Исходное сообщение
"Выпуск CRIU 3.18, системы для сохранения и восстановления состояния процессов в Linux"
Отправлено opennews , 24-Апр-23 23:03

Опубликован выпуск инструментария CRIU 3.18 (Checkpoint and Restore In Userspace), предназначенного для сохранения и восстановления процессов в пространстве пользователя. Инструментарий позволяет сохранить состояние одного или группы процессов, а затем возобновить работу с сохранённой позиции, в том числе после перезагрузки системы или на другом сервере без разрыва уже установленных сетевых соединений. Код проекта распространяется под лицензией GPLv2...
Подробнее: https://www.opennet.dev/opennews/art.shtml?num=59024

Содержание

Выпуск CRIU 3.18, системы для сохранения и восстановления со...,Аноним, 23:03 , 24-Апр-23
- Выпуск CRIU 3.18, системы для сохранения и восстановления со...,Аноним, 23:11 , 24-Апр-23
  - Выпуск CRIU 3.18, системы для сохранения и восстановления со...,Аноним, 07:12 , 25-Апр-23
  - Выпуск CRIU 3.18, системы для сохранения и восстановления со...,Аноним, 07:19 , 25-Апр-23
    - Выпуск CRIU 3.18, системы для сохранения и восстановления со...,xoy, 21:45 , 11-Май-23
  - Выпуск CRIU 3.18, системы для сохранения и восстановления со...,Аноним, 07:24 , 25-Апр-23
    - Выпуск CRIU 3.18, системы для сохранения и восстановления со...,Илья, 19:17 , 26-Апр-23
      - Выпуск CRIU 3.18, системы для сохранения и восстановления со...,AlexYeCu, 23:59 , 26-Апр-23
      - Выпуск CRIU 3.18, системы для сохранения и восстановления со...,Аноним, 08:45 , 27-Апр-23
        
        Выпуск CRIU 3.18, системы для сохранения и восстановления со...,Илья, 17:34 , 01-Май-23
- Выпуск CRIU 3.18, системы для сохранения и восстановления со...,Аноним, 23:42 , 24-Апр-23
  - Выпуск CRIU 3.18, системы для сохранения и восстановления со...,Dzen Python, 23:57 , 24-Апр-23
    - Выпуск CRIU 3.18, системы для сохранения и восстановления со...,48, 00:40 , 25-Апр-23
  - Выпуск CRIU 3.18, системы для сохранения и восстановления со...,Ivan, 11:16 , 25-Апр-23
    - Выпуск CRIU 3.18, системы для сохранения и восстановления со...,ABATAPA, 16:40 , 25-Апр-23
      - Выпуск CRIU 3.18, системы для сохранения и восстановления со...,PnD, 16:23 , 26-Апр-23
Выпуск CRIU 3.18, системы для сохранения и восстановления со...,Аноним, 23:38 , 24-Апр-23
- Выпуск CRIU 3.18, системы для сохранения и восстановления со...,PnD, 16:41 , 26-Апр-23
Выпуск CRIU 3.18, системы для сохранения и восстановления со...,Аноним, 23:41 , 24-Апр-23
- Выпуск CRIU 3.18, системы для сохранения и восстановления со...,Dzen Python, 23:56 , 24-Апр-23
  - Выпуск CRIU 3.18, системы для сохранения и восстановления со...,Аноним, 05:53 , 25-Апр-23
  - Выпуск CRIU 3.18, системы для сохранения и восстановления со...,Аноним, 08:24 , 25-Апр-23
- Выпуск CRIU 3.18, системы для сохранения и восстановления со...,Tron is Whistling, 08:42 , 25-Апр-23
  - Выпуск CRIU 3.18, системы для сохранения и восстановления со...,Олег, 21:33 , 28-Апр-23
Выпуск CRIU 3.18, системы для сохранения и восстановления со...,Sw00p aka Jerom, 23:47 , 24-Апр-23
- Выпуск CRIU 3.18, системы для сохранения и восстановления со...,Аноним, 08:24 , 25-Апр-23
  - Выпуск CRIU 3.18, системы для сохранения и восстановления со...,Sw00p aka Jerom, 09:36 , 25-Апр-23
Выпуск CRIU 3.18, системы для сохранения и восстановления со...,Аноним, 01:06 , 25-Апр-23
- Выпуск CRIU 3.18, системы для сохранения и восстановления со...,Аноним, 01:43 , 25-Апр-23
  - Выпуск CRIU 3.18, системы для сохранения и восстановления со...,Tron is Whistling, 08:44 , 25-Апр-23
    - Выпуск CRIU 3.18, системы для сохранения и восстановления со...,Бывалый смузихлёб, 16:31 , 25-Апр-23
      - Выпуск CRIU 3.18, системы для сохранения и восстановления со...,Tron is Whistling, 17:37 , 25-Апр-23
      - Выпуск CRIU 3.18, системы для сохранения и восстановления со...,Tron is Whistling, 17:38 , 25-Апр-23
    - Выпуск CRIU 3.18, системы для сохранения и восстановления со...,Аночик, 15:08 , 26-Апр-23
      - Выпуск CRIU 3.18, системы для сохранения и восстановления со...,Tron is Whistling, 08:22 , 27-Апр-23
Выпуск CRIU 3.18, системы для сохранения и восстановления со...,Аноним, 06:34 , 25-Апр-23
Выпуск CRIU 3.18, системы для сохранения и восстановления со...,Tron is Whistling, 08:47 , 25-Апр-23
- Выпуск CRIU 3.18, системы для сохранения и восстановления со...,PnD, 16:55 , 26-Апр-23
  - Выпуск CRIU 3.18, системы для сохранения и восстановления со...,Tron is Whistling, 08:26 , 27-Апр-23
    - Выпуск CRIU 3.18, системы для сохранения и восстановления со...,PnD, 11:59 , 27-Апр-23
Выпуск CRIU 3.18, системы для сохранения и восстановления со...,1, 09:18 , 25-Апр-23
Выпуск CRIU 3.18, системы для сохранения и восстановления со...,ZVVZ, 09:35 , 25-Апр-23
- Выпуск CRIU 3.18, системы для сохранения и восстановления со...,Аноним, 13:01 , 25-Апр-23
Выпуск CRIU 3.18, системы для сохранения и восстановления со...,Аноним, 09:38 , 25-Апр-23
Выпуск CRIU 3.18, системы для сохранения и восстановления со...,Аноним, 10:16 , 25-Апр-23
Выпуск CRIU 3.18, системы для сохранения и восстановления со...,Ддд, 12:04 , 25-Апр-23

Сообщения в этом обсуждении

"Выпуск CRIU 3.18, системы для сохранения и восстановления со..."
Отправлено Аноним , 24-Апр-23 23:03

Каким образом это нововведение возможно применить в девопсе?

"Выпуск CRIU 3.18, системы для сохранения и восстановления со..."
Отправлено Аноним , 24-Апр-23 23:11

Какое именно? И зачем именно в девопсе? Как мне видится невозможность сдампить GUI приложения несколько ограничивает применимость на десктопе, но всё же. Да и вроде говорили что для иксов анриал, но для вейланда возможно. Так уж получается, что какой-нибудь блендер иногда неплохо бы остановить по разным причинам.

"Выпуск CRIU 3.18, системы для сохранения и восстановления со..."
Отправлено Аноним , 25-Апр-23 07:12

Правильная, ядерная (никаких изменений в системном и прикладном ПО не требуется) реализация SSI кластера балансировки нагрузки между узлами (прозрачная миграция процессов) и правильная, реализация сохранения и восстановления процессов для Linux (прозрачное восстановление абсолютно всех процессов,включая все графические процессы): https://mirror.yandex.ru/mirrors/ftp.linux.kiev.ua/Linux/CD/.../
Исходники: https://sourceforge.net/projects/monitoring/files/hardened-o.../

"Выпуск CRIU 3.18, системы для сохранения и восстановления со..."
Отправлено Аноним , 25-Апр-23 07:19

> и вроде говорили что для иксов анриал
Лгут тебе. Выше ссылки на LiveCD и исходники ядра Linux, все оттестировано и работает.
Жаль, не смогли протолкнуть эти, ПРАВЕЛЬНЫЕ, технологии в официальное ядро. Победила красная шляпа с cgroups, namespaces, systemd+dbus+polkit.

"Выпуск CRIU 3.18, системы для сохранения и восстановления со..."
Отправлено xoy , 11-Май-23 21:45

Дела давно минувших лет - преданье старины глубокой.

"Выпуск CRIU 3.18, системы для сохранения и восстановления со..."
Отправлено Аноним , 25-Апр-23 07:24

> и вроде говорили что для иксов анриал, но для вейланда возможно
Насколько помню события 15-летней давности там разрабы поругались с технологиями cgroup, namespaces если их выкинуть с ядра, то уже есть реализация и для X11: https://sourceforge.net/projects/monitoring/files/hardened-o.../
А вейленд такое же нинужгое зло как и сыстемды с дбас.

"Выпуск CRIU 3.18, системы для сохранения и восстановления со..."
Отправлено Илья , 26-Апр-23 19:17

> А вейленд такое же нинужгое зло
А есть какой-то другой способ окна рисовать?

"Выпуск CRIU 3.18, системы для сохранения и восстановления со..."
Отправлено AlexYeCu , 26-Апр-23 23:59

>А есть какой-то другой способ окна рисовать?
Ты не поверишь…

"Выпуск CRIU 3.18, системы для сохранения и восстановления со..."
Отправлено Аноним , 27-Апр-23 08:45

X11, он более универсален, поддерживает сеть, многоголовость (DMX). Хотя и DMX в иксах недавно похерели. Наверно производители железа приплатили.

"Выпуск CRIU 3.18, системы для сохранения и восстановления со..."
Отправлено Илья , 01-Май-23 17:34

> X11, он более универсален, поддерживает сеть, многоголовость (DMX). Хотя и DMX в
> иксах недавно похерели. Наверно производители железа приплатили.
Его же усиленно выпиливают и везде рекомендуют от него отказываться.

"Выпуск CRIU 3.18, системы для сохранения и восстановления со..."
Отправлено Аноним , 24-Апр-23 23:42

Было бы неплохо смигрировать вживую контейнер с одной машины на другую, например.

"Выпуск CRIU 3.18, системы для сохранения и восстановления со..."
Отправлено Dzen Python , 24-Апр-23 23:57

М?
Прикладники научились писать софт, который не требует перезапусков раз в эн времени?
Или 640 петабайт оперативы уж точно должно хватить всем?

"Выпуск CRIU 3.18, системы для сохранения и восстановления со..."
Отправлено 48 , 25-Апр-23 00:40

А что драйверов на расте писать не собираются? или системы не состоят из контейнеров внутри виртуалок, потому что никто низачто не отвечает?

"Выпуск CRIU 3.18, системы для сохранения и восстановления со..."
Отправлено Ivan , 25-Апр-23 11:16

Жду пока в Proxmox VE добавят живую миграцию LXC контейнеров. Ранее в Promox VE работала живая миграция
OpenVZ контейнеров. После того как разработчики в Proxmox VE добавили LXC вместо OpenVZ, то они сломали живую миграцию контейнеров.

"Выпуск CRIU 3.18, системы для сохранения и восстановления со..."
Отправлено ABATAPA , 25-Апр-23 16:40

Для QEMU-контейнеров работает.

"Выпуск CRIU 3.18, системы для сохранения и восстановления со..."
Отправлено PnD , 26-Апр-23 16:23

LXC оборачивает то что умеет ядро с cgropus.
Там некому (пока?) контролировать состояние памяти (чтобы построить поверху миграцию). Максимум что можно — зафризить SIGSTOP и потом тащить всю память, до победного.
Второй проблемой будет перенос состояния CPU в новую точку запуска контейнера. И вот его в CRIU как-то сумели решить, как я понял из новости.
* "Тапки", fd etc. не упоминаю т.к. в целом тривиально.

"Выпуск CRIU 3.18, системы для сохранения и восстановления со..."
Отправлено Аноним , 24-Апр-23 23:38

Я minecraft приостанавливал посылая SIGSTOP через htop, чтоб проц не грузил, когда на паузе

"Выпуск CRIU 3.18, системы для сохранения и восстановления со..."
Отправлено PnD , 26-Апр-23 16:41

> через htop
Сотонист, не иначе.
# pkill -STOP -f XXX
# pkill -CONT -f XXX

"Выпуск CRIU 3.18, системы для сохранения и восстановления со..."
Отправлено Аноним , 24-Апр-23 23:41

А что происходит с файловыми дескрипторами? Например, программа пишет что-то в файл на нфс-шаре, мы её резко снэпшотим. Потом - восстанавливаем на другой машине с такой же нфс-шарой. Сможет ли она продолжить писать в тот же файл?
Также сокеты иксов и пульсов. Допустим я хочу перенести граф-приложение с машины на машину. Persistent storage - тот же нфс.

"Выпуск CRIU 3.18, системы для сохранения и восстановления со..."
Отправлено Dzen Python , 24-Апр-23 23:56

Отслеживание открытых файлов и маппинг на удаленной машине?
Дамп небольших файлов целиком с переносом образа процесса на удаленную машину?
Резолв соединений к БД на уровне внешних процессов-брокеров?
> Потом - восстанавливаем на другой машине с такой же нфс-шарой. Сможет ли она продолжить писать в тот же файл?
Если пути и окружение совпадает - то почему бы и нет? Главное - синхронизировать состояние целефого файла, гарантируя, что не было разрушающих формат дозаписей, т.к. снять мы можем в произвольный момент времени.
> А что происходит с файловыми дескрипторами?
Это как раз наименьшая проблема. Тут гораздо большая проблема с окружением (которое по умолчанию может быть очень отличным от машины, на которой сняли снапшот).

"Выпуск CRIU 3.18, системы для сохранения и восстановления со..."
Отправлено Аноним , 25-Апр-23 05:53

это ж как мне кажется напоминает ceph из proxmox`a

"Выпуск CRIU 3.18, системы для сохранения и восстановления со..."
Отправлено Аноним , 25-Апр-23 08:24

> Тут гораздо большая проблема с окружением (которое по умолчанию может быть очень отличным от машины, на которой сняли снапшот).
Допустим у нас контейнер, содержимое которого рсинхаем перед расснапшочиванием.

"Выпуск CRIU 3.18, системы для сохранения и восстановления со..."
Отправлено Tron is Whistling , 25-Апр-23 08:42

Главное чтобы файл за это время измениться не успел.
Иначе будет ПРИКОЛЬНО111!!!

"Выпуск CRIU 3.18, системы для сохранения и восстановления со..."
Отправлено Олег , 28-Апр-23 21:33

кеши сделабт много прикольного
уже умеют много прикольного без всяких нововведений

"Выпуск CRIU 3.18, системы для сохранения и восстановления со..."
Отправлено Sw00p aka Jerom , 24-Апр-23 23:47

Фантом ОС изобретают :)

"Выпуск CRIU 3.18, системы для сохранения и восстановления со..."
Отправлено Аноним , 25-Апр-23 08:24

Нет. Иначе повторят его судьбу.

"Выпуск CRIU 3.18, системы для сохранения и восстановления со..."
Отправлено Sw00p aka Jerom , 25-Апр-23 09:36

Лол, Фантому надо было родиться на западе, чтобы эпфийцы заценили его :) как и все остальное давным-давно изобретенное, но не оцененное.

"Выпуск CRIU 3.18, системы для сохранения и восстановления со..."
Отправлено Аноним , 25-Апр-23 01:06

> в том числе после перезагрузки системы или на другом сервере без разрыва уже установленных сетевых соединений.
Это что за чёрная магия? Как это работает?

"Выпуск CRIU 3.18, системы для сохранения и восстановления со..."
Отправлено Аноним , 25-Апр-23 01:43

>> в том числе после перезагрузки системы или на другом сервере без разрыва уже установленных сетевых соединений.
> Это что за чёрная магия? Как это работает?
За натом работает, видимо. У меня отваливались по таймауту. Если программа рассчитана на обновление соединения то всё будет работать при этом, а так вообще никто ничего не заметит.

"Выпуск CRIU 3.18, системы для сохранения и восстановления со..."
Отправлено Tron is Whistling , 25-Апр-23 08:44

Да а в чём магия-то? Дескриптор сокета и прочее переносится со всей сопутствующей инфой.
Если удалённая сторона стаймаутится не успеет - всё будет ок. У меня так SSH-сеансы после часовой отлучки в хибернейт поднимаются.

"Выпуск CRIU 3.18, системы для сохранения и восстановления со..."
Отправлено Бывалый смузихлёб , 25-Апр-23 16:31

т.е если подобную штуку запустить и на другом компе, то получится что к одному удалённому источнику установлено 2 одинаковых подключения с разных машин ?
И как тогда они будут одинаковыми, если у новой машины даже адрес будет другой ?

"Выпуск CRIU 3.18, системы для сохранения и восстановления со..."
Отправлено Tron is Whistling , 25-Апр-23 17:37

IP-адрес тоже придётся переносить
А так - да, могут даже смешаться до степени смешения, и будет весело

"Выпуск CRIU 3.18, системы для сохранения и восстановления со..."
Отправлено Tron is Whistling , 25-Апр-23 17:38

Удалённому источнику там пофиг, что у кого установлено, он тупо пакетики получает с энным адресом

"Выпуск CRIU 3.18, системы для сохранения и восстановления со..."
Отправлено Аночик , 26-Апр-23 15:08

В переносе ip адреса как минимум магия.
Ну и так по мелочи.

"Выпуск CRIU 3.18, системы для сохранения и восстановления со..."
Отправлено Tron is Whistling , 27-Апр-23 08:22

А в чём магия-то?
Снял IP на одной системе, поднял на другой.
Или роутинг изменил, а IP на lo.

"Выпуск CRIU 3.18, системы для сохранения и восстановления со..."
Отправлено Аноним , 25-Апр-23 06:34

Идея хорошая, а вот с реализацией проблемы. После нескольких заморозок процесс начинает глючить. Лучшее решение - это использование виртуализации и снапшотов.

"Выпуск CRIU 3.18, системы для сохранения и восстановления со..."
Отправлено Tron is Whistling , 25-Апр-23 08:47

Вообще сама идея мне честно говоря нравится. Можно перетащить большой долгоживущий процесс с машины на машину и машину обслужить.
Другое дело, что лично мне оно вообще почти не надо, потому что я строго соблюдаю принцип "одна машина - одна задача" + дублирование/кластеризацию, а контейнерщикам со всякими мокросервисами не надо вообще - их проще грохнуть и перезапустить. Но вот когда у тебя есть какая-то махровая проприетарь или щастье, которое ни задублировать, ни погасить на время обслуживания хост-системы, может быть интересно.
Надо с астериском попробовать - кто-нибудь пробовал?

"Выпуск CRIU 3.18, системы для сохранения и восстановления со..."
Отправлено PnD , 26-Апр-23 16:55

Э, зачэм астериск? © анекдот про гусей.
Немного не понял смысл упражнения. Не, ну перетащить "прогретую" jvm с одного физ. хоста (без гипервизора-прослойки потому что HFT /а почему тогда java?/ или ещё какая фигня) наверное ок.
Но астер-то зачем вот так???

"Выпуск CRIU 3.18, системы для сохранения и восстановления со..."
Отправлено Tron is Whistling , 27-Апр-23 08:26

Это смотря что у вас на астериске.
У нас есть больничные кол-центры, которые даже блин не раскидать по нодам - там столько стейта, что обмениваться этим стейтом между узлами синхронно очково - малейший чих, и звонки встанут. Обновлять хост-систему на таких нодах - очень лютая тема.

"Выпуск CRIU 3.18, системы для сохранения и восстановления со..."
Отправлено PnD , 27-Апр-23 11:59

> У нас есть больничные кол-центры, которые даже блин не раскидать по нодам
Да, "положить" дежурную больницу — отдельная песТня, перед заходом на "посадку".
Я такие штуки прокладывал xen (ну и qemu в DM, как без него). Потому что там легче доказать свою невиноватость. (И такой подход впоследствии отлично зашёл в PCI-DSS.)
Но, т.к. x86-железо (да хотя бы и ARM|Power|etc., протекающему PJSIP [20 байт на входящий по последним замерам] вообще пофиг) в нашей унылой реальности "складывается" примерно всегда. Проектировал так чтобы "сложившийся" узел оборвал текущие звонки. (В этом месте никого не привлекут если все регламенты проведены по журналам.) А новые сразу шли на резерв. Чего и вам желаю.
* Если в системе нет регламента для штатного (без сбоев в обслуживании) вывода из нагрузки, то я даже не знаю что сказать…

"Выпуск CRIU 3.18, системы для сохранения и восстановления со..."
Отправлено 1 , 25-Апр-23 09:18

Идея хороша, хотя бы для обновления ядра без остановки компа ...
Продумать, чтоб новое ядро перехватывало процессы и вуаля - правильные 24/7

"Выпуск CRIU 3.18, системы для сохранения и восстановления со..."
Отправлено ZVVZ , 25-Апр-23 09:35

Что только не делают. лишь бы Plan9/Inferno не пилить

"Выпуск CRIU 3.18, системы для сохранения и восстановления со..."
Отправлено Аноним , 25-Апр-23 13:01

А на них так можно разве?

"Выпуск CRIU 3.18, системы для сохранения и восстановления со..."
Отправлено Аноним , 25-Апр-23 09:38

Ждем в proxmox для ha lxc контейнеров

"Выпуск CRIU 3.18, системы для сохранения и восстановления со..."
Отправлено Аноним , 25-Апр-23 10:16

Почему нельзя просто скопировать machine1:/proc/$pid1 на machine2:/proc/$pid2
?

"Выпуск CRIU 3.18, системы для сохранения и восстановления со..."
Отправлено Ддд , 25-Апр-23 12:04

В демке они игры на лету между датацентрами по планете перекидывали и игра не осианавливалась