Small Language Models (SLM) představují novou generaci modelů umělé inteligence, které se zaměřují na efektivitu, rychlost a specializaci. Na rozdíl od svých „velkých bratrů“ (LLM) mají výrazně méně parametrů, ale díky kvalitním datům dosahují překvapivých výsledků.
Zatímco modely jako GPT-4 pracují se stovkami miliard až biliony parametrů, SLM se obvykle pohybují v rozmezí 1 až 10 miliard parametrů.
| Parametr | LLM (např. GPT-4) | SLM (např. Phi-3) |
|---|---|---|
| Velikost | Stovky GB / Terabajty | Jednotky GB |
| Hardware | GPU clustery (H100) | Běžné CPU / Mobilní čipy |
| Využití | Všeobecné znalosti, komplexní úvahy | Specializované úlohy, asistenti |
| Cena za dotaz | Vyšší (API poplatky) | Téměř nulová (vlastní HW) |
Příklad: Firma může nasadit SLM pro analýzu interních smluv. Model běží na firemním serveru, nikdo zvenčí k datům nemá přístup a odpovědi jsou generovány okamžitě v rámci interního systému.
— Viz také: