====== TPU (Tensor Processing Unit) ====== **TPU** je integrovaný obvod specifický pro danou aplikaci (ASIC), který Google vyvinul od základu pro svůj framework [[it_encyklopedie:tensorflow|TensorFlow]]. Jeho hlavním cílem je poskytnout řádově vyšší výkon při nižší spotřebě energie pro trénování a inferenci (provoz) velkých modelů AI, jako jsou [[it_encyklopedie:llm|LLM]] nebo [[it_encyklopedie:diffusion_model|difuzní modely]]. ===== 1. Architektura: Proč je TPU jiný? ===== Klíčem k výkonu TPU je architektura **Systolic Array** (systolické pole). * **CPU/GPU:** Při každém výpočtu musí procesor přistupovat k paměti (registru), provést operaci a výsledek uložit. To vytváří úzké hrdlo (tzv. von Neumannovo hrdlo). * **TPU:** Data protékají polem aritmetických jednotek jako vlna (podobně jako krev v srdci – odtud "systolické"). Tisíce násobení a sčítání proběhnou v jednom taktu bez neustálého zápisu do paměti. To extrémně zrychluje **násobení matic**, což je 90 % práce při trénování AI. ===== 2. Srovnání: CPU vs. GPU vs. TPU ===== ^ Procesor ^ Charakteristika ^ Přirovnání ^ | **CPU** | Flexibilní, zvládne jakýkoli kód, ale pomalu. | Švýcarský nůž. | | **GPU** | Tisíce jader pro paralelní výpočty (grafika, AI). | Rychlá dodávka (uveze hodně balíků najednou). | | **TPU** | Extrémně rychlý, ale pouze pro specifické AI operace. | Nákladní vlak na vyhrazené trati. | ===== 3. Generace TPU ===== Google neustále vyvíjí nové verze, které jsou dostupné skrze **Google Cloud Platform (GCP)**: * **v1:** Pouze pro inferenci (používání již hotových modelů). * **v2 a v3:** Přidána podpora pro trénování modelů a možnost zapojení do tzv. **TPU Podů** (superpočítačů). * **v4 a v5p:** Současná špička, optimalizovaná pro trénování obřích modelů jako Gemini nebo PaLM. ===== 4. Cloud TPU a TPU Pods ===== TPU se běžně neprodávají jako samostatné karty do PC (jako NVIDIA GPU). Jsou dostupné jako cloudová služba. * **TPU Pod:** Seskupení stovek až tisíců TPU čipů propojených ultra-rychlou sítí. To umožňuje trénovat modely, které by na běžných počítačích trvaly roky, během několika dnů. ===== 5. Výhody a omezení ===== **Výhody:** * **Výkon na watt:** Mnohem úspornější než GPU při stejném výkonu. * **Rychlost:** Ideální pro obří maticové operace v hlubokém učení. * **Ekosystém:** Perfektní integrace s Google Cloud a frameworky TensorFlow/JAX. **Omezení:** * **Specializace:** Špatně si poradí s kódem, který není založen na tenzorech (např. klasické větvení programu). * **Uzavřenost:** Hardware vlastní a provozuje výhradně Google. * **Cena:** Pronájem výkonných TPU verzí může být pro menší projekty velmi nákladný. > **Zajímavost:** TPU čipy byly použity k poražení světového šampiona ve hře Go systémem **AlphaGo**. Právě díky TPU mohl systém propočítat miliony tahů v reálném čase během zápasu. [[it_encyklopedie:hardware_rozcestnik|Zpět na Hardware]]