Компания Илона Маска OpenAI разработала нейросеть, которая создает изображения по текстовому запросу. Программное обеспечение называется DALL-E. В названии зашифровано имя знаменитого сюрреалиста. Нейросеть, словно художник, создает оригинальное изображение. Правда, видение у нейросети достаточно своеобразное.

До DALL-E существовали и другие системы, создающие картинки по текстовому запросу. Но работали системы плохо, рисунки совсем не соответствовали заданным словам. Нейросети от Илона Маска удается детальнее и точнее изобразить текст — пусть и со своим роботизированным взглядом. Например, наберешь в окошке слово «очень красивая собака» — и через минуту нейросеть выдает сгенерированное изображение ухоженной болонки. 

«DALL-E состоит из нескольких нейросетей, две отвечают за перевод текста в изображение. Обычно у таких нейросетей получаются бредовые изображения на выходе, и поэтому используют еще две нейросети, которые сравнивают полученное изображение и оригинальный текст на сходство», — объясняет специалист по машинному обучению и разработчик компании Napoleon IT Владимир Фоменко.

В России создали русский аналог нейросети — ruDALL-E Malevich, он в отличие от оригинала доступен всем. Работает приложение по тому же принципу, что и DALL-E. В дета-сет (это набор данных для обучения) были загружены русскоязычные материалы, в том числе статьи из «Википедии».

Мы решили опробовать русский аналог нейросети ruDALL-E Malevich и проверить, как получится у бота нарисовать челябинские улицы и достопримечательности по текстовому запросу.

Челябинск

Городские пейзажи от нейросети лучше рассматривать издалека. Шагов с десяти. Подойдешь чуть ближе, и понимаешь, что это и не дома вовсе, а разноцветные пятна, только притворяющиеся зданиями.

Как ни странно, городские локации в картинках все-таки угадываются. На этой, например, затесался шпиль главного корпуса ЮУрГУ.

ЮУрГУ

Кажется, нейросеть попыталась нарисовать памятник вечному студенту. Правда, студент уже не молод, на лице борода. Может, теперь это памятник вечному преподавателю? Позирующему на фоне зданий общежитий.

Памятник Орленку

У нейросети явно свой вкус на памятники, и сюрреализм она уважает. Что изображено на постаменте? Рыба? Голова обезьяны? Непонятно. Возможно, понять эту картинку может только другая нейросеть.

Кировка

Дольше обычного генерирует картинку. В итоге вылепляется из нескольких рандомных фотографий дом, напоминающий то ли здание кинотеатра «Знамя», то ли киоск по продаже билетов. Нейросеть явно не гуляла по главной пешеходной улице Челябинска.


Цирк

Не знаем, как так вышло, но цирк почему-то больше похож гипермаркет «Магнит». Даже купол какой-то картонный, и сверху торчит труба производственного цеха.

Набережная

Картинки набережной — словно выхолощенная иллюстрации архитектурного проекта. Ничего лишнего: только водная гладь и ровная линия парапета, причем парапет узнаваемый.

Пейзаж напоминает абрис новой набережной за филармонией.

Ледовая арена «Трактор»

Общую концепцию нейросеть угадала. Лед есть? Есть. Разметка для игры в хоккей есть? Да. Даже трибуны проглядываются. Не хватает только игроков хоккейного клуба «Трактор».


Челябинский вокзал

Мнения в редакции на этот счет разделились: кто-то говорит, что на изображении вылитый челябинский вокзал, кто-то считает, что совсем нет. Витражей нет! И куполообразной крыши тоже.

Памятник Курчатову

По версии нейросети, у Курчатова был брат-близнец. Сиамский. Их вдвоем слили в единый монумент на фоне городского бора. Есть мнение, что это Ельцин и Ленин. Кому-то один из брутальных персонажей напомнил все же Курчатова — бородой.

Копейск

Эту картину мог бы нарисовать Сальвадор Дали. Судя по всему, сюрреалистический монумент сгенерирован из фотографий площади Трудовой Славы, даже угадывается пиццерия в центре.

Челябинский метеорит

Искусственный интеллект честно собрал все в одну картинку: и вспышку от метеорита, и его «хвост», и мрачные дома. Странно, что на картинке нет видеорегистратора.


Челябинский аквапарк

Аквапарк еще не построен, но нейросеть показала, как он может выглядеть. Надеемся, что все-таки будет не так.


Как отмечает разработчик Владимир Фоменко, со временем подобные нейросети смогут заменить фотостоки. Но пока сервисы не готовы для этого и требуют больших вычислительных ресурсов для доработок.