May 10, 13:22

Nvidia показала офигенный алгоритм:

Как вы знаете, чтобы заставить нейронку узнавать собак, нужно ей показать 4 000 собак, пару сотен НЕ собак, и вот – у вас нейронка которая может узнать «собаку».

Проблема с таким подходом в том, что собаки бывают разных пород, а фото с разных ракурсов – когда мы учим детей, мы же им всего пару раз показываем картинки собаки и они дальше уже как-то сами понимают, что на картинке – собака. То есть люди не повторяют друг другу 4 000 раз что-то чтобы обучить человека новому объекту. И если вам нужно представить как выглядит собака которая лежит, то вы без труда это сделаете без новых данных.

Алгоритм от Nvidia работает привычно к нашему пониманию – на вход подается фотография собаки и дальше нейронка способна узнать любое похожее животное которое ей дали на вход (У животного должны быть уши, нос, глаза и тп), и что важно, почти в любой позе.

Помимо этого, нейронка способна «смешивать классы» – если на исходном фото у собаки отрыта пасть и вывалился язык, то так будет на всех картинках которые она генерирует.

Прогноз DARPA сбывается, третий вид ИИ подоспел.

Вот тут можно поиграться самому (лучше загружать фото собак в профиль):

nvlabs.github.io/FUNIT/petswap.html

Тут исходный код:

github.com/NVlabs/FUNIT

А тут видео с подробностями:

youtu.be/kgPAqsC8PLM