February 01, 2017

Я часто пишу о датасетах которые нужны для того чтобы нейронка начала что-то "узнавать" – на самом деле это просто набор картинок (если мы про визуальные образы) обработанных специальным образом – обрезаных до одного размера, где лица, если это лица, расположены по центру картинки, при определенном свете и тп. В общем не магия, но интересно тут именно ко-во информации нужное для "скармливания" нейронке – "дофига" это как-то не число вовсе, поэтому кто-то сделал проект: automato.farm/portfolio/trainning-cards/

Чуваки распечатали 5000 карточек с собаками и получили 1.2 метра карточек или 8 килограмм картинок, этого кол-ва информации достаточно чтобы алгоритм начал узнавать собаку.

И тут странное – они продают этот набор за 5000 долларов. Многие часто обсуждают о том кто и как зарабатывает с помощью машинного обучения, ну что же, у этих чуваков самый странный способ из всех что я видел – на карточках с собаками.

Там по ссылке еще детали проекта, ниже фото набора.