Obsah

Neural ODEs (Neural Ordinary Differential Equations)

Neural ODEs představují revoluční přístup k architektuře neuronových sítí, kde namísto specifikování posloupnosti diskrétních skrytých vrstev definujeme spojitý vývoj stavu sítě pomocí obyčejných diferenciálních rovnic (ODE).

Tento koncept byl představen v roce 2018 (Chen et al.) a získal ocenění za nejlepší příspěvek na prestižní konferenci NeurIPS.

Rozdíl mezi klasickou sítí a Neural ODE

Klasické sítě (ResNet)

V běžných reziduálních sítích se stav mění v diskrétních krocích: $h_{t+1} = h_t + f(h_t, \theta_t)$ Kde $h_t$ je stav v dané vrstvě a $f$ je funkce (vrstva) s parametry $\theta$.

Neural ODEs

V Neural ODEs tento vztah zobecňujeme do spojitého času. Změnu stavu popisujeme derivací: $$\frac{dh(t)}{dt} = f(h(t), t, \theta)$$ Pro získání výstupu v čase $T$ pak síť „řeší“ tento systém od počátečního stavu $h(0)$ pomocí numerického řešiče (ODE Solver).

Hlavní výhody Neural ODEs

Využití v praxi

Oblast Aplikace
Fyzikální simulace Modelování pohybu tekutin, planetárních drah nebo robotiky, kde platí fyzikální zákony.
Medicína Analýza nepravidelně měřených dat od pacientů (např. srdeční tep v čase).
Generativní modely Základ pro spojité normalizační toky (Continuous Normalizing Flows), které transformují jednoduché distribuce na komplexní data.

Výzvy a omezení

Související pojmy: Hluboké učení, Vertex AI, Architektury CPU (vliv na efektivitu výpočtů)