====== Computer Vision (Počítačové vidění) ====== **Computer Vision** (CV) transformuje obrazová data na číselné nebo symbolické informace. Cílem je naučit počítač "vidět" a "rozumět" obsahu scény podobně jako člověk, ale s rychlostí a precizností stroje. Využívá k tomu pokročilé algoritmy, statistiku a v poslední dekádě především hluboké učení (Deep Learning). ---- ====== Jak Computer Vision funguje? ====== Proces interpretace obrazu obvykle probíhá v několika fázích: 1. **Získávání obrazu:** Senzor (kamera) zachytí scénu a převede ji na matici [[pixel|pixelů]]. 2. **Předzpracování:** Odstranění šumu, úprava jasu nebo kontrastu, aby byl obraz čitelnější pro algoritmus. 3. **Extrakce rysů (Feature Extraction):** Algoritmus hledá hrany, rohy, textury nebo specifické tvary. 4. **Rozpoznávání a klasifikace:** Interpretace nalezených rysů a jejich přiřazení k určitému objektu nebo akci. ---- ====== Hlavní úlohy počítačového vidění ====== Počítačové vidění se dělí na několik klíčových disciplín: * **Klasifikace obrazu:** Určení, co je na obrázku (např. "toto je pes"). * **Detekce objektů:** Identifikace a lokalizace objektů v obraze (označení psa v rámečku). * **Sémantická segmentace:** Rozdělení obrazu na jednotlivé části podle významu (např. v autonomním řízení: "toto je silnice", "toto je chodec"). * **Rozpoznávání obličejů:** Identifikace konkrétní osoby podle biometrických znaků. * **OCR (Optical Character Recognition):** Převod tištěného nebo psaného textu do digitální podoby. ---- ====== Technologie a algoritmy ====== Historicky se CV spoléhalo na ručně navržené filtry, ale moderní éra patří neuronovým sítím: * **CNN (Convolutional Neural Networks):** Konvoluční neuronové sítě jsou základem moderního CV. Dokážou se samy naučit rozpoznávat složité vzory (od jednoduchých hran až po celé obličeje). * **Edge Computing:** Zpracování obrazu přímo v zařízení (kameře), což snižuje latenci a nároky na přenos dat. * **Stereovize a LiDAR:** Využití dvou kamer nebo laserů k získání prostorových (3D) informací o scéně. ---- ====== Praktické využití v reálném světě ====== ^ Obor ^ Příklady použití ^ | **Autonomní vozidla** | Rozpoznávání dopravních značek, jízdních pruhů a překážek na cestě. | | **Zdravotnictví** | Analýza rentgenových snímků a MRI k detekci nádorů nebo zlomenin. | | **Průmysl** | Kontrola kvality na linkách (hledání vad v produktech). | | **Zabezpečení** | Identifikace osob na letištích, rozpoznávání SPZ vozidel. | | **Zábava** | Filtry v aplikacích (Snapchat, Instagram), rozšířená realita (AR). | ---- ====== Výzvy a limity ====== Počítačové vidění stále naráží na určité problémy: * **Světelné podmínky:** Stíny, odlesky nebo tma mohou výrazně snížit přesnost. * **Změna perspektivy:** Počítač může mít problém rozpoznat objekt, pokud jej vidí z neobvyklého úhlu. * **Interpretace kontextu:** Rozlišit mezi obrázkem psa a skutečným psem v reálném světě může být pro některé systémy stále náročné. ---- //Související pojmy: Pixel, Umělá inteligence, Neuronové sítě, Robotika, OCR, Deep Learning, Senzor.//