December 21, 2018

Пару дней назад общались с коллегами по поводу GAN нейронных сетей (Что такое GAN на примере Prisma) и коллеги задали вопрос, а где можно использовать такую архитектуру нейронной сети и кому вообще это может быть нужно?

Мне кажется это интересным вопросом, и хороший повод подвести какие-то GAN-итоги-2018, поэтому я соберу тут те алгоритмы которые я встречал, ссылок будет много, но вроде все хорошие.

Важно сказать, что пока что больше всего исследований вокруг GAN связано с какими-то визуальными эффектами, хотя такие нейронки могут генерировать прекрасную музыку уже сейчас.

GAN-нейронки позволяют генерировать картинки разных стилей художников, создавать видео, генерировать объекты которые вообще не существует (вроде лиц тут), дорисовывать фото "улучшая" фото – например, если у вас селфи так себе, то нейронка уберет морщинки, добавит улыбку, сделает фото "лайкабельным" или просто улучшит качество изображения, а самое главное – все это в высоком разрешении.

Или, к примеру, отдаете нейронной сети книгу, а на выходе она рисует картинку для каждой сцены, что есть в книге – превращая текст в картинки.

Само собой, такая доступность технологии означает, что 2019 году нас ждет еще больше дипфейков всех видов, последний раз я собрал их тут, если у вас есть классные – кидайте мне в личку, я всегда рад.

GAN позволяет генерировать любые объекты если у вас есть достаточно данных – от аниме персонажей, текстур, 3D-моделей из 2D-фото, до смены поз на фотографиях.

Самое странное, и мало изученное – что GAN-нейронная сеть может смешивать "классы" этих объектов – что из этого выйдет, мы пока не знаем.

В общем, это был очень богатый год на различные исследования, конечно в одном посте нельзя перечислить все, что понравилось –мое мнение такое, что GAN-тенденции одни из самых перспективных в IT на следующие несколько лет.

Кстати, если вы не так давно подписались на канал, и вам интересно, как работает нейронная сеть в целом, то вот прекрасное и понятное видео из 2х частей которое все расскажет.

#итоги2018