Obsah

LAM (Large Action Model)

LAM je typ modelu umělé inteligence navržený tak, aby porozuměl lidským záměrům a dokázal je autonomně realizovat prostřednictvím interakce s uživatelským rozhraním (UI) aplikací a webových stránek.

Namísto toho, aby model pouze popsal, jak něco udělat, LAM se sám přihlásí do aplikace, klikne na tlačítka, vyplní formuláře a úkol dokončí.

Rozdíl mezi LLM a LAM

Vlastnost LLM (např. GPT-4) LAM (např. Rabbit R1 OS)
Hlavní výstup Text, kód, obrázky Akce (kliknutí, nákup, rezervace)
Pracovní prostor Pravděpodobnost slov Uživatelská rozhraní (UI) aplikací
Příklad Napíše recept na pizzu Objedná pizzu přes aplikaci

Jak LAM funguje?

Tradiční automatizace (jako API) vyžaduje, aby vývojáři propojili každý systém zvlášť. LAM se však učí jinak:

Hlavní výhody

Známé implementace a příklady

Výzvy a rizika

Bezpečnost: Pokud dáte LAMu přístup ke svým účtům, model může teoreticky provést nechtěné nákupy nebo smazat data.
Spolehlivost: Pokud webová stránka změní design, model se může splést a kliknout na špatné místo.

Související: AI agent, LLM, RPA (Robotic Process Automation)