Нейросеть GauGAN 2.0 от Nvidia научилась рисовать картины по словесному описанию

Главная особенность GauGAN не только в распознавании сути пользовательских запросов, но и внимании к деталям, которые они хотели бы отразить. В идеале, она может на основе текстовых и графических указаний поменять произвольным образом форму, размер и текстуру любого объекта на рисунке. И при этом сохранить общую гармоничность и целостность полотна, которое в итоге выглядит как фотография или искусная картина.

Чтобы ИИ так тонко понимал человеческие запросы, генеративно-состязательную модель обучали на примерах 10 млн различных пейзажей. Поэтому она понимает, чем отличается «припорошенный грязью валун на берегу» от «перекатывающихся камней в прибое», и может нарисовать и то, и другое в одном кадре. Что еще интереснее, изменения отображаются в реальном времени, по мере составления запроса. Зайдите на сайт нейросети и почувствуйте себя творцом!

источник

"Популярная Механика"