May 28, 19:02

Продолжаю разбирать новости за ту неделю:

MIT показали нейронную сеть Speech2Face которая пытается «визуализировать» внешность человека по его голосу (учитывается акцент, возраст, пол, этническая принадлежность и тп).

Чтобы «синтезировать» лицо нейросеть сначала определяет пол и возраст человека, а также выясняет национальность по наличию акцента – выходит вроде ничего, обучали алгоритм на коротких видео из ютуба, точнее, на 100 000 разных человек.

Вот тут можно почитать детали на русском.

А тут оригинальный документ на английском.

В общем, работает пока не очень: