LAM (Large Action Model)

LAM je typ modelu umělé inteligence navržený tak, aby porozuměl lidským záměrům a dokázal je autonomně realizovat prostřednictvím interakce s uživatelským rozhraním (UI) aplikací a webových stránek.

Namísto toho, aby model pouze popsal, jak něco udělat, LAM se sám přihlásí do aplikace, klikne na tlačítka, vyplní formuláře a úkol dokončí.

Rozdíl mezi LLM a LAM

Vlastnost	LLM (např. GPT-4)	LAM (např. Rabbit R1 OS)
Hlavní výstup	Text, kód, obrázky	Akce (kliknutí, nákup, rezervace)
Pracovní prostor	Pravděpodobnost slov	Uživatelská rozhraní (UI) aplikací
Příklad	Napíše recept na pizzu	Objedná pizzu přes aplikaci

Jak LAM funguje?

Tradiční automatizace (jako API) vyžaduje, aby vývojáři propojili každý systém zvlášť. LAM se však učí jinak:

Pozorování UI: Model se učí sledováním toho, jak lidé používají aplikace (kde jsou tlačítka „Koupit“, „Hledat“ atd.).
Pochopení struktury: Dokáže interpretovat vizuální prvky a logiku aplikací, i když se jejich vzhled mírně změní.
Mapování záměru na akci: Přeloží požadavek v přirozeném jazyce („Najdi mi nejlevnější let do Londýna“) na sekvenci technických kroků v prohlížeči nebo aplikaci.

Hlavní výhody

Univerzálnost: Nepotřebuje oficiální API od výrobce aplikace – ovládá ji jako člověk.
Komplexní workflow: Dokáže propojit více aplikací dohromady (např. vzít data z Excelu, vložit je do CRM a poslat o tom zprávu na Slack).
Jednoduchost pro uživatele: Uživatel nemusí umět ovládat 50 různých aplikací, stačí mu hlasový nebo textový příkaz.

Známé implementace a příklady

Rabbit R1: Kapesní zařízení, které bylo postaveno na konceptu LAM (předvádělo objednávání jídla či Uberu).
Browser-based Agents: Modely jako MultiOn nebo Skyvern, které dokáží samostatně procházet web a vyřizovat nákupy nebo administrativu.
OpenAI (Operator): Chystané nástroje, které umožní ChatGPT přímo ovládat váš počítač.

—

Výzvy a rizika

Bezpečnost: Pokud dáte LAMu přístup ke svým účtům, model může teoreticky provést nechtěné nákupy nebo smazat data.
Spolehlivost: Pokud webová stránka změní design, model se může splést a kliknout na špatné místo.

Související: AI agent, LLM, RPA (Robotic Process Automation)