URL: https://www.opennet.dev/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID3
Нить номер: 117114
[ Назад ]

Исходное сообщение
"NVIDIA открыла код системы машинного обучения, синтезирующей..."

Отправлено opennews , 13-Апр-19 11:19 
Компания NVIDIA опубликовала (https://nvlabs.github.io/SPADE/) исходные тексты системы машинного обучения  SPADE (https://nvlabs.github.io/SPADE/) (GauGAN), позволяющей синтезировать реалистичные пейзажи на основе грубых набросков, а также связанные с проектом нетренированные модели (https://drive.google.com/file/d/12gvlTbMvUcJewQlSEaZdeb2CdOB.... Система была продемонстрирована (https://blogs.nvidia.com/blog/2019/03/18/gaugan-photorealist... в марте на конференции GTC 2019, но код был опубликован только вчера. Наработки открыты (https://github.com/NVlabs/SPADE) под лицензией CC BY-NC-SA 4.0 (https://creativecommons.org/licenses/by-nc-sa/4.0/) (Creative Commons Attribution-NonCommercial-ShareAlike 4.0), допускающей использование только в некоммерческих целях. Код написан на языке Python с применением фреймворка PyTorch (https://pytorch.org/).


Наброски оформляются в виде сегментированной карты, определяющей размещение примерных объектов на сцене. Характер генерируемых объектов задаётся при помощи цветовых меток. Например, голубая заливка преобразуется в небо, синяя в воду, тёмно зелёная в деревья, светло  зелёная в траву, светло коричневая в камни, тёмно коричневая в горы, серая в снег, коричневая линия преобразуется в дорогу, а синяя линия в реку. Дополнительно на основе выбора эталонных изображений определяется общий стиль композиции и время суток. Предлагаемый инструмент для создания виртуальных миров может оказаться полезным широкому кругу специалистов,  от архитекторов и планировщиков городской среды до разработчиков игр и ландшафтных дизайнеров.

Объекты синтезируются генеративно-состязательной нейронной сетью (GAN (https://ru.wikipedia.org/wiki/%D0%93%D0%... которая на основе схематичной сегментированной карты создаёт реалистичные изображения, заимствуя детали из модели, предварительно обученной на нескольких миллионах фотоснимков. В отличие от ранее развиваемых систем синтеза изображений предложенный метод основан на применении адаптивного пространственного преобразования с последующей трансформацией на основе машинного обучения. Обработка сегментированной карты вместо семантической разметки позволяет добиться точного соответствия результата и  контролировать стиль.


Для достижения реалистичности применяются две конкурирующие друг с другом нейронных сети: генератор и дискриминатор (Discriminator). Генератор формирует изображения на основе смешивания элементов реальных фотографий, а дискриминатор выявляет возможные отклонения от реальных изображений. В итоге формируется обратная связь, на основе которой генератор начинает компоновать всё более качественные образцы, до тех пор пока дискриминатор не перестанет отличать их от настоящих.

URL: https://github.com/NVlabs/SPADE
Новость: https://www.opennet.dev/opennews/art.shtml?num=50507


Содержание

Сообщения в этом обсуждении
"NVIDIA открыла код системы машинного обучения, синтезирующей..."
Отправлено dimcha , 13-Апр-19 11:19 
ОГНИЩЕ!!!!!

"NVIDIA открыла код системы машинного обучения, синтезирующей..."
Отправлено Аноним , 13-Апр-19 11:22 
Всё стремится к примитивности. Такими темпами скоро появятся "желтые" заголовки в стиле - "шимпонзе создала картину превосходящую по технике Ван Гога!" и "мой кот повторяет шедевры Пикассо!"

"NVIDIA открыла код системы машинного обучения, синтезирующей..."
Отправлено commiethebeastie , 13-Апр-19 12:38 
Мой кот умнее анонима.

"NVIDIA открыла код системы машинного обучения, синтезирующей..."
Отправлено Аноним , 13-Апр-19 15:23 
Ей, осторожнее, я и есть твой кот.

"NVIDIA открыла код системы машинного обучения, синтезирующей..."
Отправлено Ordu , 13-Апр-19 13:52 
https://www.brecorder.com/2019/04/11/488194/scientists-put-h.../

"NVIDIA открыла код системы машинного обучения, синтезирующей..."
Отправлено Попугай Кеша , 15-Апр-19 17:08 
"Планета обезьян" из фантастики становится возможным будущим

"NVIDIA открыла код системы машинного обучения, синтезирующей..."
Отправлено qwerty_qwerty1 , 15-Апр-19 10:26 
Искусство, вообще понятие субъективное. Так что да, ваш кот не сможет нечего создать, а вот мои рыбки те да гениальны.  

"NVIDIA открыла код системы машинного обучения, синтезирующей..."
Отправлено Zenitur , 13-Апр-19 11:27 
А можно ли конвертировать игры для CGA и EGA в HiRes в реальном времени?

"NVIDIA открыла код системы машинного обучения, синтезирующей..."
Отправлено Аноним , 13-Апр-19 14:41 
Нет, конечно. Оно на питоне написано.

"NVIDIA открыла код системы машинного обучения, синтезирующей..."
Отправлено Аноним , 13-Апр-19 16:50 
На питоне там только обвязка, производительность которой некритична. Сама нейросеть работает нативно.

"NVIDIA открыла код системы машинного обучения, синтезирующей..."
Отправлено Аноним , 13-Апр-19 17:06 
Для real-time приложения, а другое для игр не получится, обвязка на питоне сожрёт любые доступные ресурсы

"NVIDIA открыла код системы машинного обучения, синтезирующей..."
Отправлено Аноним , 13-Апр-19 22:47 
Сказали же - computation graph обученной нейросети не нуждается в обвязке на питоне, конструирующей сеть и обучающей её. Нужна только тупая обвязка на С++, прокидывающая картинку из текстуры OpenGL в код на OpenCL и обратно путём биндинга некоторых объектов, ещё нужна обвязка, грузящая код из файла. Но суперпупер 3д игры не ожидайте - от кадра к кадру пропущенная через сеть картинка будет очень разная, от такой игры даже у здрового человека голова заболит. Для суперпупер 3д надо уметь векторизовать и восстанавливать 3д информацию, а это уже пахнет вокселями и 3д-нейросетью заместо полигональных моделей, а это уже неподъёмно.

"NVIDIA открыла код системы машинного обучения, синтезирующей..."
Отправлено Аноним , 14-Апр-19 03:49 
EVE Online на пайтоне. И ничего... работает!

"NVIDIA открыла код системы машинного обучения, синтезирующей..."
Отправлено анонимз , 14-Апр-19 07:07 
http://www.the8bitguy.com/243/cga-graphics-not-bad-thought/ ;) в реальности CGA поддерживает емнип 16 цветов, а не 4, но нужен композитный монитор или телевизор

"NVIDIA открыла код системы машинного обучения, синтезирующей..."
Отправлено Ordu , 16-Апр-19 19:23 
Круто. Люблю такие исторические ретроспективы. Интересно, будут ли в вузах будущего читать курс истории микрокомпьютеров, где будущие историки будут учится писать скроллеры под cgi, или записывать на 5" дискету 1600Kb? Или всё это так и забудут, так же как многие тысячи пневматических уличных часов, показывавших централизованно синхронизированное время по всему Парижу на стыке XIX и XX веков. Лет же пятьдесят эти часы отработали, а потом их просто вышвырнули на помойку, и забыли успешно. Неблагодарные хомячки-потребители.

"NVIDIA открыла код системы машинного обучения, синтезирующей..."
Отправлено freehck , 13-Апр-19 11:34 
Молодцы, что открыли, фигли. Поясните кто-нибудь, кто разбирается, и у кого есть время посмотреть: рисование картин по шаблонам вроде как тема очень не новая, в связи с чем вопрос; в части построения слоёв там что-нибудь принципиально новое есть, или это просто демонстраци того, как оптимизировать это дело под NVidia?

"NVIDIA открыла код системы машинного обучения, синтезирующей..."
Отправлено Аноним , 13-Апр-19 12:01 
Здесь наглядное сравнение с аналогами https://nvlabs.github.io/SPADE/images/coco_comparison.jpg при обучении на одной и той же коллекции картинок. Насколько я понял принципиальная разница в том, что сеть начинает поступательно улучшать полученную на входе мазню до уровня реализма без отдельной фазы нормализации.


"NVIDIA открыла код системы машинного обучения, синтезирующей..."
Отправлено Аноним , 13-Апр-19 12:23 
Драйверы под линь лучше бы написала и открыла

"NVIDIA открыла код системы машинного обучения, синтезирующей..."
Отправлено Аноним , 13-Апр-19 22:49 
Зачем, если они и так монополист и всех вертели?

"NVIDIA открыла код системы машинного обучения, синтезирующей..."
Отправлено Аноним , 13-Апр-19 12:27 
>Грым не знал точно, как работает доводчик — и никто толком не знал. Дамилола сказал только, что в нём заложен тот же алгоритм, что и в Кае — программа учитывает всё, когда-то сказанное людьми, все бесчисленные смысловые выборы, которые делались в течение веков и сохранились в информационных анналах. Пальцы Грыма как бы управляли армией мёртвых душ, двигавших для него кубики слов.

"NVIDIA открыла код системы машинного обучения, синтезирующей..."
Отправлено Анонимс , 13-Апр-19 12:51 
> Объекты синтезируются генеративно-состязательной нейронной сетью (GAN), которая на основе схематичной сегментированной карты создаёт реалистичные изображения, заимствуя детали из модели, предварительно обученной на нескольких миллионах фотоснимков

Видимо, скоро актёры в голливуде останутся без работы. Нажал на кнопку, а ИИ тебе сгенерировал 100500 новых, реалистичных актёров, которые будут делать всё, что пожелаешь.


"NVIDIA открыла код системы машинного обучения, синтезирующей..."
Отправлено EuPhobos , 13-Апр-19 14:12 
Рендерить рожи якобы "знаменитостей" уже умеет
https://youtu.be/VrgYtFhVGmg?t=19

"NVIDIA открыла код системы машинного обучения, синтезирующей..."
Отправлено Аноним , 13-Апр-19 14:30 
Да и пес с ними с актерами.

"NVIDIA открыла код системы машинного обучения, синтезирующей..."
Отправлено Аноним , 14-Апр-19 11:04 
Действительно, что нам актёры? Такое впечатление, что анонимы "Generation П" не читали.

"NVIDIA открыла код системы машинного обучения, синтезирующей..."
Отправлено Аноним , 13-Апр-19 13:38 
Кривая гладь воды радует

"NVIDIA открыла код системы машинного обучения, синтезирующей..."
Отправлено Crazy Alex , 13-Апр-19 14:23 
И давно NC-лицензии стали свободными?

"NVIDIA открыла код системы машинного обучения, синтезирующей..."
Отправлено GG , 13-Апр-19 16:19 
Они не стали, это пропаганда копирастов.

"NVIDIA открыла код системы машинного обучения, синтезирующей..."
Отправлено Аноним , 13-Апр-19 17:32 
Да, CC BY-NC-SA 4.0 ограничивает свободу распространения, поэтому называть ее свободной нельзя. И очень странно использование CC для ПО - видимо, нестыковка как раз в этом. Данные лицензии применяют для документов. Ну вот, например, проекты распространяются под GPL v3 (исходники и бинарные сборки для всех ОС), а документация к ним, имеющая самостоятельную литературную и научную ценность, под CC-BY-SA 4.0. Считаю такой подход более корректным.

"NVIDIA открыла код системы машинного обучения, синтезирующей..."
Отправлено GG , 13-Апр-19 19:09 
Нет, для документации есть GNU FDL.
Лицензии CC были придуманы и навязаны копирастами для рисованов, чтобы те пилили закопирастеные картинки, которые в свободном ПО использовать или проблематично или вообще невозможно.

"NVIDIA открыла код системы машинного обучения, синтезирующей..."
Отправлено Аноним , 13-Апр-19 19:51 
Каждый вправе выбрать сам лицензию или придумать свою. Был приведен только пример. Некоторые нюансы делают GNU FDL менее предпочтительной, чем CC BY-SA, для указанного типа документации. Кстати, о картинках. Недавно один из интересных ресурсов изображений перешел с СС  на собственную лицензию. А Википедия наоборот - с GNU на СС.

"NVIDIA открыла код системы машинного обучения, синтезирующей..."
Отправлено Аноним , 13-Апр-19 22:51 
Вообще-то просто cc-by, cc-by-sa и cc-0 вполне свободные лицензии. И Лессиг против копирастии.

"NVIDIA открыла код системы машинного обучения, синтезирующей..."
Отправлено GG , 13-Апр-19 23:38 
Нет, не свободные, т.к. не требуют выдачи исходников в случае производной работы (бинарник, например).

"NVIDIA открыла код системы машинного обучения, синтезирующей..."
Отправлено shpinog , 14-Апр-19 13:04 
Слово " требовать" и "свобода", как то странно приравниваются... кто сказала что свободная лицензия должна что-то требовать, MIT.

"NVIDIA открыла код системы машинного обучения, синтезирующей..."
Отправлено Аноним , 13-Апр-19 16:41 
Кто-нибудь картинку с саванным шимпанзе уже проверял?

"NVIDIA открыла код системы машинного обучения, синтезирующей..."
Отправлено Аноним , 13-Апр-19 17:58 
Если бы у "Нашего человека в Гаване" была такая штука, ему не пришлось бы срисовывать чертежи пылесоса...

"NVIDIA открыла код системы машинного обучения, синтезирующей..."
Отправлено Аноним , 14-Апр-19 05:12 
чистый синтез это процедурная генерация(ассембл.+ Си) а тут просто микширование картинок по шаблонам с добавлением эффектов. На современных видяхах используя чистую генерацию можно творить невероятные реалтайм шедевры умещающиеся в пару мегабайт вместо сотен гигов машинно обученой базы.

"NVIDIA открыла код системы машинного обучения, синтезирующей..."
Отправлено Аноним , 14-Апр-19 09:06 
> На современных видяхах используя чистую генерацию можно творить невероятные реалтайм шедевры умещающиеся в пару мегабайт

Ссылки на (желательно, свободные) примеры в студию.


"NVIDIA открыла код системы машинного обучения, синтезирующей..."
Отправлено Vitaliy Blats , 14-Апр-19 17:38 
Каждая школота знала про Bryce.

Ты из поколения ЕГЭ шоле ?


"NVIDIA открыла код системы машинного обучения, синтезирующей..."
Отправлено Попугай Кеша , 15-Апр-19 17:10 
Bryce - зачетная тема, могу еще накинуть - Vue (Avatar) / Terragen (использовался в Sucker Punch)

"NVIDIA открыла код системы машинного обучения, синтезирующей..."
Отправлено Аноним , 14-Апр-19 09:49 
Хаха, осталось только придумать процедуру (и закодить). В этом и прелесть нейронных сетей (грубо говоря, она сама придумывают процедуру). В этом же и её слабость (на ком натренирована).

"NVIDIA открыла код системы машинного обучения, синтезирующей..."
Отправлено Аноним , 14-Апр-19 15:16 
Нейронная сеть не

> придумывают процедуру


"NVIDIA открыла код системы машинного обучения, синтезирующей..."
Отправлено Аноним , 14-Апр-19 19:24 
Грубо говоря же. Вообще, тут долго можно спорить об определениях, что есть обучение, что есть интеллект или мышление.

"NVIDIA открыла код системы машинного обучения, синтезирующей..."
Отправлено Аноним , 15-Апр-19 11:11 
А можно точно также, но с электронными компонентами?

"NVIDIA открыла код системы машинного обучения, синтезирующей..."
Отправлено Аноним , 16-Апр-19 10:43 
"Послушай, Успенский с тобой говорит. Здесь за окном офигительный вид.". Гуглим дальше.

"NVIDIA открыла код системы машинного обучения, синтезирующей..."
Отправлено Попугай Кеша , 16-Апр-19 13:38 
На чем научили )