Zpět na blog
·Honza Tyl·1 min čtení·Archiv 2018

Co je to autoencoder a jak komprimuje data?

Pokračuji ve studiu umělé inteligence v „ruské škole“. Je to škola tvrdá, ale dobrá. Trvalo mi 10 minut než jsem vyřešil úlohu s autoenkóderem…

Co je to autoencoder a jak komprimuje data?

Pokračuji ve studiu umělé inteligence v „ruské škole“. Je to škola tvrdá, ale dobrá. Trvalo mi 10 minut než jsem vyřešil úlohu s autoenkóderem s chybovostí 6,7%, ale trvalo to tři dny experimentování, než jsem zkrotil velikost chyby na 5%.

První úloha spočívá v tom, že natrénuji jednu síť nazvanou encoder tak, aby zakódovala obrázek lidské tváře co nejefektivněji do pár číslic (na obrázku je to 32 číslic). Pak natrénuji druhou síť nazvanou decoder, aby se z těchto pár číslic pokusila znovu rekonstruovat obrázek. Je to vlastně chytrá a ztrátová superkomprese obrázku.

32 číslic je na popis obrázku dost málo. Síť se musí soustředit jen na to důležité. Jak se vám výsledky líbí?

Fotka uživatele Umělá inteligence.

Fotka uživatele Umělá inteligence.

Tady se to povedlo celkem hezky. Tvář zrekonstruovaná z pouhých 32 čísel je si podobná a působí jen poněkud rozmazaně.

Fotka uživatele Umělá inteligence.

Trošku horší výsledek je dán pravděpodobně nerovnoměrným rozložením datasetu. Síť nepřesně rekonstruuje širší nos a plná při-otevřená ústa.

Fotka uživatele Umělá inteligence.

Vcelku hezká rekonstrukce. Připadá mi, že poněkud zmírnila ostré rysy.

Fotka uživatele Umělá inteligence.

Tak tady to pěkně odnesly brýle. Jejich struktura je na tak silnou kompresi moc složitá. Také výraz úst byl přeložen jako nějaký běžnější.

Původní zdroj: wordpress

Související články