Computer Vision (CV) transformuje obrazová data na číselné nebo symbolické informace. Cílem je naučit počítač „vidět“ a „rozumět“ obsahu scény podobně jako člověk, ale s rychlostí a precizností stroje. Využívá k tomu pokročilé algoritmy, statistiku a v poslední dekádě především hluboké učení (Deep Learning).
Proces interpretace obrazu obvykle probíhá v několika fázích:
1. **Získávání obrazu:** Senzor (kamera) zachytí scénu a převede ji na matici [[pixel|pixelů]]. 2. **Předzpracování:** Odstranění šumu, úprava jasu nebo kontrastu, aby byl obraz čitelnější pro algoritmus. 3. **Extrakce rysů (Feature Extraction):** Algoritmus hledá hrany, rohy, textury nebo specifické tvary. 4. **Rozpoznávání a klasifikace:** Interpretace nalezených rysů a jejich přiřazení k určitému objektu nebo akci.
Počítačové vidění se dělí na několik klíčových disciplín:
Historicky se CV spoléhalo na ručně navržené filtry, ale moderní éra patří neuronovým sítím:
| Obor | Příklady použití |
|---|---|
| Autonomní vozidla | Rozpoznávání dopravních značek, jízdních pruhů a překážek na cestě. |
| Zdravotnictví | Analýza rentgenových snímků a MRI k detekci nádorů nebo zlomenin. |
| Průmysl | Kontrola kvality na linkách (hledání vad v produktech). |
| Zabezpečení | Identifikace osob na letištích, rozpoznávání SPZ vozidel. |
| Zábava | Filtry v aplikacích (Snapchat, Instagram), rozšířená realita (AR). |
Počítačové vidění stále naráží na určité problémy:
Související pojmy: Pixel, Umělá inteligence, Neuronové sítě, Robotika, OCR, Deep Learning, Senzor.