Computer Vision (Počítačové vidění)

Computer Vision (CV) transformuje obrazová data na číselné nebo symbolické informace. Cílem je naučit počítač „vidět“ a „rozumět“ obsahu scény podobně jako člověk, ale s rychlostí a precizností stroje. Využívá k tomu pokročilé algoritmy, statistiku a v poslední dekádě především hluboké učení (Deep Learning).

Jak Computer Vision funguje?

Proces interpretace obrazu obvykle probíhá v několika fázích:

1. **Získávání obrazu:** Senzor (kamera) zachytí scénu a převede ji na matici [[pixel|pixelů]].
2. **Předzpracování:** Odstranění šumu, úprava jasu nebo kontrastu, aby byl obraz čitelnější pro algoritmus.
3. **Extrakce rysů (Feature Extraction):** Algoritmus hledá hrany, rohy, textury nebo specifické tvary.
4. **Rozpoznávání a klasifikace:** Interpretace nalezených rysů a jejich přiřazení k určitému objektu nebo akci.

Hlavní úlohy počítačového vidění

Počítačové vidění se dělí na několik klíčových disciplín:

Klasifikace obrazu: Určení, co je na obrázku (např. „toto je pes“).
Detekce objektů: Identifikace a lokalizace objektů v obraze (označení psa v rámečku).
Sémantická segmentace: Rozdělení obrazu na jednotlivé části podle významu (např. v autonomním řízení: „toto je silnice“, „toto je chodec“).
Rozpoznávání obličejů: Identifikace konkrétní osoby podle biometrických znaků.
OCR (Optical Character Recognition): Převod tištěného nebo psaného textu do digitální podoby.

Technologie a algoritmy

Historicky se CV spoléhalo na ručně navržené filtry, ale moderní éra patří neuronovým sítím:

CNN (Convolutional Neural Networks): Konvoluční neuronové sítě jsou základem moderního CV. Dokážou se samy naučit rozpoznávat složité vzory (od jednoduchých hran až po celé obličeje).
Edge Computing: Zpracování obrazu přímo v zařízení (kameře), což snižuje latenci a nároky na přenos dat.
Stereovize a LiDAR: Využití dvou kamer nebo laserů k získání prostorových (3D) informací o scéně.

Praktické využití v reálném světě

Obor	Příklady použití
Autonomní vozidla	Rozpoznávání dopravních značek, jízdních pruhů a překážek na cestě.
Zdravotnictví	Analýza rentgenových snímků a MRI k detekci nádorů nebo zlomenin.
Průmysl	Kontrola kvality na linkách (hledání vad v produktech).
Zabezpečení	Identifikace osob na letištích, rozpoznávání SPZ vozidel.
Zábava	Filtry v aplikacích (Snapchat, Instagram), rozšířená realita (AR).

Výzvy a limity

Počítačové vidění stále naráží na určité problémy:

Světelné podmínky: Stíny, odlesky nebo tma mohou výrazně snížit přesnost.
Změna perspektivy: Počítač může mít problém rozpoznat objekt, pokud jej vidí z neobvyklého úhlu.
Interpretace kontextu: Rozlišit mezi obrázkem psa a skutečným psem v reálném světě může být pro některé systémy stále náročné.

Související pojmy: Pixel, Umělá inteligence, Neuronové sítě, Robotika, OCR, Deep Learning, Senzor.