Konvoluční neuronová síť (CNN – Convolutional Neural Network) je typ hluboké neuronové sítě, která je speciálně navržena pro zpracování dat s mřížkovou strukturou, typicky obrázků. Na rozdíl od běžných sítí dokáže efektivně využívat prostorové souvislosti mezi pixely a automaticky se učit hierarchii vizuálních prvků (od hran až po složité objekty).
Zatímco klasická síť by ztratila informaci o tom, že dva pixely sousedí, CNN si tuto informaci udržuje díky procesu zvanému konvoluce.
Typická CNN se skládá ze tří hlavních typů vrstev:
Základní stavební kámen. Malý filtr (jádro/kernel) se posouvá přes obrázek a provádí matematické operace (násobení a součet). Tím vzniká tzv. Feature Map (mapa příznaků), která zvýrazňuje specifické rysy (např. svislé čáry, rohy nebo textury).
Slouží ke zmenšení prostorové dimenze dat (downsampling). Nejčastější je Max Pooling, který z bloku pixelů vybere jen ten s nejvyšší hodnotou. To snižuje počet parametrů, zrychluje výpočty a pomáhá síti být odolnou vůči malým posunům objektu v obraze.
Nachází se na samém konci sítě. Bere všechny extrahované příznaky a na jejich základě provede finální rozhodnutí (klasifikaci) – např. „na obrázku je pes s pravděpodobností 98 %“.
http://googleusercontent.com/image_collection/image_retrieval/957308609600523173_0
Jedinečnost CNN spočívá v tom, jak se postupně učí chápat obraz:
http://googleusercontent.com/image_collection/image_retrieval/725189359314178719_0
| Oblast | Příklad aplikace |
|---|---|
| Klasifikace obrazu | Určení, zda je na fotce rentgenový nález nebo zdravá tkáň. |
| Detekce objektů | Vyznačení rámečků kolem chodců a aut v samořiditelných vozech. |
| Segmentace | Přesné ohraničení silnice pixel po pixelu. |
| Obličejová biometrie | Odemknutí chytrého telefonu pomocí FaceID. |
| Zpracování videa | Analýza pohybu ve sportu nebo bezpečnostních systémech. |
Zajímavost: Architektura CNN byla původně inspirována výzkumem zrakové kůry koček (Hubel & Wiesel, 1959), který ukázal, že určité neurony v mozku reagují pouze na specifické tvary v určitých částech zorného pole.