Moderní počítačová architektura již nespoléhá pouze na syrový výkon jednotlivých jader procesoru (CPU) nebo výpočetních bloků grafických akcelerátorů (GPU). Klíčovým úzkým hrdlem (bottleneck) současných systémů je rychlost, jakou si tyto komponenty dokáží vyměňovat data. Sběrnice a propojovací rozhraní definují propustnost, latenci a topologii celého systému.
Tento článek podrobně rozebírá tři klíčové technologie: univerzální průmyslový standard PCIe, vnitročipové a mezičipové rozhraní AMD Infinity Fabric a specializovaný vysokorychlostní GPU propoj NVIDIA NVLink.
Peripheral Component Interconnect Express (PCIe) je celosvětový standard pro vysokorychlostní sériovou sběrnici, který slouží k připojení interních hardwarových komponent (grafické karty, NVMe SSD disky, síťové a zvukové karty) k základní desce a procesoru.
Na rozdíl od starších paralelních sběrnic (PCI, PCI-X), které sdílely stejné vodiče pro všechna zařízení, využívá PCIe výhradně bod-bod (point-to-point) topologii. Každé připojené zařízení má své vlastní vyhrazené spojení s kořenovým komplexem (Root Complex) v procesoru nebo čipsetu.
Základní stavební jednotkou PCIe je linka (Lane). Jedna linka se skládá ze dvou diferenciálních párů vodičů – jeden pár pro odesílání dat (TX) a jeden pár pro příjem dat (RX), což umožňuje plně duplexní (simultánní obousměrný) provoz. Sloty na základní desce se dělí podle počtu linek:
Každá nová generace PCIe přibližně zdvojnásobuje propustnost oproti té předchozí. Tento nárůst je dán zvyšováním taktovací frekvence a optimalizací kódování. Zatímco starší PCIe 2.0 využívalo kódování 8b/10b (20% režie na opravu chyb), PCIe 3.0 přešlo na efektivnější kódování 128b/130b (režie pouze 1,5 %).
Od generace PCIe 6.0 dochází k revoluční změně – namísto kódování NRZ (Non-Return-to-Zero, dva stavy 0 a 1) se přechází na signály PAM4 (Pulse Amplitude Modulation 4), které přenášejí 4 napěťové úrovně, a dokáží tak v jednom cyklu přenést dvojnásobek dat.
Následující hodnoty reprezentují teoretickou propustnost v jednom směru:
AMD Infinity Fabric je proprietární systémová architektura a propojovací rozhraní vyvinuté společností AMD. Představuje klíčovou technologii, která umožnila masivní úspěch chipletového designu v procesorech Ryzen, EPYC a výpočetních GPU Radeon.
Místo výroby jednoho obřího monolitického křemíkového čipu (což je extrémně drahé a vykazuje vysokou zmetkovost) skládá AMD procesory z několika menších samostatných čipů (čipletů). V procesorech Ryzen se jedná o výpočetní čiplety (CCD - Core Complex Die) a centrální vstupně-výstupní čiplet (IOD - I/O Die). Infinity Fabric funguje jako extrémně rychlé a nízko-latenční „lepidlo“, které tyto čiplety navzájem propojuje.
Architektura se dělí na dvě funkční vrstvy:
U desktopových procesorů AMD Ryzen je taktovací frekvence vnitřní sběrnice Infinity Fabric (FCLK) standardně synchronizována s frekvencí řadiče paměti (UCLK) a reálnou frekvencí operačních pamětí DDR (MCLK). Pro dosažení nejnižší možné latence je kritické udržovat tento poměr v synchronním režimu 1:1. Při přetaktování RAM nad optimální limit dojde k rozpojení této vazby, což paradoxně sníží herní výkon kvůli penalizaci v latenci.
NVIDIA NVLink je specializované, vysokorychlostní, sériové, drátové propojovací rozhraní s podporou paměťové koherence, vyvinuté společností NVIDIA. Bylo navrženo specificky pro potřeby paralelních výpočtů, superpočítačů (HPC) a masivního trénování velkých jazykových modelů (AI / LLM).
V systémech s více grafickými kartami připojenými přes standardní sběrnici PCIe musí vzájemná komunikace mezi GPU často probíhat přes procesor (CPU) a systémovou RAM, což způsobuje masivní zpoždění a propady rychlosti. NVLink toto úzké hrdlo zcela odstraňuje. Umožňuje přímé spojení typu GPU-to-GPU nebo GPU-to-CPU (u procesorů NVIDIA Grace). Díky hardwarové koherenci umožňuje technologii Unified Memory – spojené grafické karty mohou sdílet své lokální paměti (VRAM) a vytvořit jeden obří, společný paměťový fond přístupný pro všechna jádra.
Ve velkých serverových sestavách (např. architektury NVIDIA DGX) je NVLink doplněn o hardwarové přepínače NVSwitch. Tyto specializované čipy na základní desce fungují jako dedikované síťové routery pro grafické karty, což umožňuje propojit desítky až stovky GPU do jedné obří výpočetní sítě, kde každá karta komunikuje s libovolnou jinou kartou plnou rychlostí bez omezení.
Propustnost NVLinku se udává jako celková agregovaná obousměrná šířka pásma na jeden čip:
| Vlastnost | PCI Express (PCIe) | AMD Infinity Fabric | NVIDIA NVLink |
|---|---|---|---|
| Typ rozhraní | Otevřený průmyslový standard | Proprietární vnitro/mezičipový spoj | Proprietární high-speed GPU propoj |
| Primární nasazení | Připojení periferií (GPU, SSD) k CPU | Propojení čipletových bloků (AMD) | Propojení akcelerátorů v AI / HPC |
| Paměťová koherence | Pouze s rozšířením CXL (PCIe 5.0+) | Plná hardwarová koherence | Plná hardwarová koherence |
| Max. propustnost (2026) | ~121 GB/s (PCIe 6.0 x16) | Stovky GB/s (podle verze pouzdra) | Až 1,8 TB/s (NVLink 5.0 / Blackwell) |
| Topologie | Stromová (přes Root Complex / Switche) | Prstencová / Mesh (uvnitř CPU) | Mesh / Plný crossbar (přes NVSwitch) |
| Hardwarová kompatibilita | Univerzální (Intel, AMD, NVIDIA, ARM) | Výhradně architektury AMD | Výhradně enterprise hardware NVIDIA |