====== BigQuery ====== **BigQuery** je plně spravovaný, serverless (bezserverový) datový sklad pro podnikovou analýzu dat. Umožňuje provádět bleskové dotazy nad obrovskými soubory dat (řádově petabajty) pomocí standardního jazyka **SQL**. Je to tzv. **SaaS** (Software as a Service) řešení, což znamená, že uživatel nemusí spravovat žádnou infrastrukturu, disky ani databázové servery. Vše se škáluje automaticky podle potřeby. ===== Technická architektura: Dremel ===== Unikátní rychlost BigQuery je dána technologií nazvanou **Dremel**. Ta využívá dvě zásadní inovace: * **Sloupcové ukládání (Columnar Storage):** Na rozdíl od klasických databází nečte BigQuery celé řádky, ale pouze sloupce, které jsou v dotazu potřeba. To drasticky snižuje množství čtených dat z disků. * **Masivní paralelismus:** BigQuery rozdělí jeden dotaz na tisíce menších částí, které zpracovávají tisíce procesorů současně. Výsledky se pak bleskově složí dohromady. ===== Klíčové vlastnosti ===== * **Serverless:** Nemusíte rezervovat výkon. Platíte buď za množství zpracovaných dat, nebo za rezervovanou kapacitu (slots). * **BigQuery ML:** Umožňuje vytvářet a spouštět modely strojového učení ([[hluboke_uceni|Machine Learning]]) přímo pomocí SQL příkazů, bez nutnosti exportovat data do jiných nástrojů. * **BI Engine:** Rychlá paměťová vrstva (in-memory), která umožňuje okamžitou vizualizaci dat v nástrojích jako Looker nebo Tableau. * **Integrace s GCP:** Nativní propojení s [[vertex_ai|Vertex AI]], Cloud Storage a dalšími službami Googlu. ===== Srovnání: Tradiční DB vs. BigQuery ===== ^ Vlastnost ^ Tradiční SQL Databáze ^ BigQuery ^ | **Účel** | Transakční operace (zápis objednávky). | Analytické operace (výpočet ročních tržeb). | | **Škálování** | Omezené výkonem serveru. | Prakticky neomezené (tisíce nodů). | | **Správa** | Nutnost ladit indexy a hardware. | Žádné indexy, žádná správa HW. | | **Ukládání** | Data uložena v řádcích. | Data uložena ve sloupcích. | ===== BigQuery a AI ===== V současnosti (2025-2026) hraje BigQuery zásadní roli v ekosystému [[gemini_historie_a_soucasnost|Gemini]]. Díky funkci **BigQuery Continuous Queries** lze v reálném čase posílat data z databáze přímo do modelů umělé inteligence ve [[vertex_ai|Vertex AI]] a okamžitě získávat analýzy, souhrny nebo předpovědi. --- //Související pojmy: [[gcp|GCP]], [[vertex_ai|Vertex AI]], [[hluboke_uceni|Hluboké učení]], [[https://it-slovnik.cz/pojem/sql|SQL]]//