Vertex AI je ucelená cloudová platforma společnosti Google pro strojové učení (Machine Learning), která je součástí Google Cloud Platform (GCP). Jejím účelem je sjednotit všechny nástroje pro vývoj, trénování a nasazování modelů umělé inteligence do jednoho prostředí.
Umožňuje vývojářům využívat jak vlastní modely, tak i pokročilé modely od Googlu (např. Gemini, PaLM 2, Imagen).
Vertex AI se skládá z několika klíčových komponent, které pokrývají celý životní cyklus AI (tzv. MLOps):
Katalog hotových modelů. Uživatelé si zde mohou vybrat:
Nástroj pro rychlé experimentování. Zde mohou vývojáři testovat prompty, nastavovat parametry modelu (teplota, top-k) a ladit odpovědi bez nutnosti psát složitý kód.
Nástroj pro automatizaci. Pomáhá spravovat celý proces od sběru dat, přes trénování na čipech TPU (vyvíjených ve spolupráci s Broadcomem), až po nasazení do produkce.
| Funkce | Popis |
|---|---|
| Fine-tuning | Doškolení modelu na vlastních datech firmy (např. právní dokumenty nebo interní kód). |
| Grounding | Propojení modelu s reálnými daty (např. Google Search), aby se snížilo riziko halucinací. |
| Vector Search | Vyhledávání informací na základě významu, nikoliv jen klíčových slov. |
| AutoML | Automatizovaný vývoj modelů pro uživatele, kteří nejsou experty na datovou vědu. |
Vertex AI je unikátní tím, že běží na vlastní infrastruktuře Googlu. Využívá:
Před příchodem Vertex AI musely firmy kombinovat desítky různých nástrojů. Vertex AI tento proces „demokratizuje“ – umožňuje i menším firmám využívat stejnou sílu, jakou má Google, a stavět na ní vlastní řešení se zárukou ochrany soukromí (data nahraná do Vertex AI se nepoužívají k trénování veřejných modelů Gemini).
— Související pojmy: Gemini, Hluboké učení, Broadcom, TSMC, OpenAI