Označování dat může být oříšek. Je to hlavní zdroj obživy pro modely počítačového vidění; bez něj by měli velké potíže s identifikací objektů, lidí a dalších důležitých obrazových charakteristik. Přesto může výroba pouhé hodiny označených a označených dat zabrat neuvěřitelných 800 hodin lidského času. Naše vysoce přesné chápání světa se rozvíjí, protože stroje mohou lépe vnímat naše okolí a interagovat s ním. Potřebují ale další pomoc.
Vědci z MIT's Computer Science and Artificial Intelligence Laboratory (CSAIL), Microsoft a Cornell University se pokusili vyřešit tento problém sužující modely vidění vytvořením „STEGO“, algoritmu, který dokáže společně objevovat a segmentovat objekty bez jakýchkoli lidských štítků. vše až na pixel.
STEGO se učí něčemu, co se nazývá „sémantická segmentace“ – je to proces přiřazování štítku každému pixelu v obrázku. Sémantická segmentace je důležitou dovedností pro dnešní systémy počítačového vidění, protože obrazy mohou být zaplněné předměty. Ještě náročnější je, že tyto předměty ne vždy zapadají do doslovných krabic; Algoritmy mají tendenci pracovat lépe pro diskrétní „věci“, jako jsou lidé a auta, než pro „věci“, jako je vegetace, obloha a bramborová kaše. Předchozí systém mohl jednoduše vnímat jemnou scénu psa hrajícího si v parku jako pouhého psa, ale přiřazením každého pixelu obrázku ke každému pixelu může STEGO obrázek rozdělit na jeho hlavní složky: pes, obloha, tráva a jeho vlastníkem.