====== LSTM (Long Short-Term Memory) ====== **LSTM** je speciální typ [[it_encyklopedie:rekurentni_neuronova_sit|rekurentní neuronové sítě]] (RNN), která je schopna se učit dlouhodobé závislosti v datech. Byla navržena Seppem Hochreiterem a Jürgenem Schmidhuberem v roce 1997 jako řešení problému **mizejícího gradientu** (vanishing gradient), kvůli kterému standardní RNN zapomínaly informace ze začátku dlouhých sekvencí. Zatímco běžná RNN má v každém kroku jednoduchou strukturu (např. jednu vrstvu s funkcí tanh), LSTM uzel (buňka) obsahuje složitý systém "bran", které regulují tok informací. ===== 1. Struktura buňky LSTM ===== Klíčem k LSTM je **stav buňky** (cell state) – horizontální linka procházející horní částí schématu, která funguje jako "dopravní pás" pro informace. Brány (gates) pak rozhodují, co se na tento pás přidá a co se z něj odstraní. ==== A. Zapomínací brána (Forget Gate) ==== Rozhoduje o tom, které informace z předchozího stavu již nejsou důležité a mají být vymazány. * **Příklad:** Pokud věta mluví o novém podmětu, můžeme zapomenout rod toho předchozího. ==== B. Vstupní brána (Input Gate) ==== Určuje, které nové informace ze současného vstupu budou uloženy do stavu buňky. Skládá se ze dvou částí: jedna vybere hodnoty k aktualizaci a druhá vytvoří nové kandidáty na uložení. ==== C. Výstupní brána (Output Gate) ==== Na základě aktuálního stavu buňky rozhodne, co bude výsledným výstupem (hidden state) pro tento krok. Tento výstup je pak předán další buňce v sekvenci. ===== 2. Proč je LSTM "inteligentnější"? ===== Díky těmto branám si LSTM dokáže udržet důležitou informaci (např. podmět věty) po velmi dlouhou dobu, i když mezi ním a souvisejícím slovem (např. slovesem na konci souvětí) leží desítky jiných slov. ===== 3. Srovnání: RNN vs. LSTM ===== ^ Vlastnost ^ Standardní RNN ^ LSTM ^ | **Paměť** | Velmi krátká (jednotky kroků). | Dlouhá (stovky až tisíce kroků). | | **Komplexita** | Nízká (1 aktivační funkce). | Vysoká (4 vrstvy s různými funkcemi). | | **Trénování** | Rychlé, ale často neúspěšné. | Pomalejší, ale mnohem stabilnější. | | **Využití** | Jednoduché časové řady. | Překlad textu, generování řeči. | ===== 4. Praktické aplikace ===== * **Google Translate:** Do roku 2016 (před nástupem Transformerů) byl systém postaven primárně na LSTM. * **Siri a Alexa:** Rozpoznávání hlasových povelů a syntéza řeči. * **Analýza finančních trhů:** Předvídání cen akcií na základě historických trendů. * **Psaní textu:** Predikce dalšího slova na klávesnicích mobilních telefonů. > **Zajímavost:** Architektura LSTM byla tak úspěšná, že dominovala oblasti AI téměř 20 let, dokud v roce 2017 nepřišel článek "Attention Is All You Need", který představil [[it_encyklopedie:transformer|Transformery]]. [[it_encyklopedie:ai_rozcestnik|Zpět na AI rozcestník]]