Neuronové sítě (Neural Networks)

Neuronové sítě jsou výpočetní modely inspirované strukturou a funkcí biologických neuronových sítí v mozku. Jsou základním stavebním kamenem hlubokého učení (Deep Learning) a umožňují počítačům učit se z komplexních dat, jako jsou obrázky, zvuk nebo přirozený jazyk.

1. Anatomie umělého neuronu

Základní jednotkou je umělý neuron (perceptron). Ten přijímá vstupy, zpracovává je a generuje výstup.

Klíčové komponenty neuronu:

Vstupy ($x_1, x_2, \dots, x_n$): Data přicházející z předchozí vrstvy nebo senzoru.
Váhy ($w_1, w_2, \dots, w_n$): Parametry určující důležitost každého vstupu. Učení sítě spočívá v hledání ideálních hodnot těchto vah.
Bias ($b$): Konstanta, která umožňuje posunout aktivační funkci tak, aby model lépe odpovídal datům.
Sumační funkce: Neuron sečte vážené vstupy a přičte bias: $$z = \sum (x_i \cdot w_i) + b$$
Aktivační funkce: Určuje, zda a s jakou intenzitou bude signál poslán dál.

2. Typy aktivačních funkcí

Aktivační funkce vnášejí do sítě nelinearitu, což jí umožňuje řešit složité problémy.

Název	Vzorec	Charakteristika
Sigmoid	$\sigma(z) = \frac{1}{1 + e^{-z}}$	Vrací hodnoty mezi 0 a 1. Dříve populární, dnes vytlačována.
ReLU	$f(z) = \max(0, z)$	Nejpoužívanější. Lineární pro kladné hodnoty, nula pro záporné. Rychlá a efektivní.
Softmax	$\dots$	Používá se v poslední vrstvě pro klasifikaci (převádí výstupy na pravděpodobnosti).

3. Architektura vícevrstvé sítě (MLP)

Standardní síť, známá jako Multi-Layer Perceptron, se skládá z:

1. **Input Layer (Vstupní vrstva):** Každý neuron reprezentuje jeden příznak (např. jeden pixel).
2. **Hidden Layers (Skryté vrstvy):** Vrstvy mezi vstupem a výstupem. Zde dochází k učení abstrakcí (např. hrany -> tvary -> obličej).
3. **Output Layer (Výstupní vrstva):** Poskytuje finální predikci.

4. Jak probíhá učení?

Učení sítě je iterační proces, který se skládá ze dvou hlavních kroků:

Dopředný chod (Forward Propagation)

Data projdou sítí od vstupu k výstupu. Na konci se vypočítá ztrátová funkce (Loss Function), která měří, jak moc se predikce sítě liší od skutečnosti.

Zpětná propagace (Backpropagation)

Algoritmus vypočítá, jakou měrou ke chybě přispěl každý neuron. Pomocí gradientního sestupu (Gradient Descent) se pak váhy upraví tak, aby byla chyba v dalším kroku menší.

5. Hlavní typy neuronových sítí

Podle architektury dělíme sítě pro specifické úkoly:

CNN (Convolutional Neural Networks): Specializované na obrazy. Využívají konvoluční filtry k detekci vzorů v prostoru.
RNN (Recurrent Neural Networks): Mají „paměť“, jsou vhodné pro sekvenční data (časové řady, zvuk).
Transformers: Moderní architektura využívající „Self-Attention“. Základ modelů jako GPT nebo BERT.

Související témata:

Tagy: ai neural_networks deep_learning math