Sběrnice a rozhraní: PCIe, Infinity Fabric a NVLink

Moderní počítačová architektura již nespoléhá pouze na syrový výkon jednotlivých jader procesoru (CPU) nebo výpočetních bloků grafických akcelerátorů (GPU). Klíčovým úzkým hrdlem (bottleneck) současných systémů je rychlost, jakou si tyto komponenty dokáží vyměňovat data. Sběrnice a propojovací rozhraní definují propustnost, latenci a topologii celého systému.

Tento článek podrobně rozebírá tři klíčové technologie: univerzální průmyslový standard PCIe, vnitročipové a mezičipové rozhraní AMD Infinity Fabric a specializovaný vysokorychlostní GPU propoj NVIDIA NVLink.

1. PCI Express (PCIe)

Peripheral Component Interconnect Express (PCIe) je celosvětový standard pro vysokorychlostní sériovou sběrnici, který slouží k připojení interních hardwarových komponent (grafické karty, NVMe SSD disky, síťové a zvukové karty) k základní desce a procesoru.

Architektura a princip fungování

Na rozdíl od starších paralelních sběrnic (PCI, PCI-X), které sdílely stejné vodiče pro všechna zařízení, využívá PCIe výhradně bod-bod (point-to-point) topologii. Každé připojené zařízení má své vlastní vyhrazené spojení s kořenovým komplexem (Root Complex) v procesoru nebo čipsetu.

Základní stavební jednotkou PCIe je linka (Lane). Jedna linka se skládá ze dvou diferenciálních párů vodičů – jeden pár pro odesílání dat (TX) a jeden pár pro příjem dat (RX), což umožňuje plně duplexní (simultánní obousměrný) provoz. Sloty na základní desce se dělí podle počtu linek:

Generace a evoluce propustnosti

Každá nová generace PCIe přibližně zdvojnásobuje propustnost oproti té předchozí. Tento nárůst je dán zvyšováním taktovací frekvence a optimalizací kódování. Zatímco starší PCIe 2.0 využívalo kódování 8b/10b (20% režie na opravu chyb), PCIe 3.0 přešlo na efektivnější kódování 128b/130b (režie pouze 1,5 %).

Od generace PCIe 6.0 dochází k revoluční změně – namísto kódování NRZ (Non-Return-to-Zero, dva stavy 0 a 1) se přechází na signály PAM4 (Pulse Amplitude Modulation 4), které přenášejí 4 napěťové úrovně, a dokáží tak v jednom cyklu přenést dvojnásobek dat.

Následující hodnoty reprezentují teoretickou propustnost v jednom směru:

Výhody a limity

2. AMD Infinity Fabric (IF)

AMD Infinity Fabric je proprietární systémová architektura a propojovací rozhraní vyvinuté společností AMD. Představuje klíčovou technologii, která umožnila masivní úspěch chipletového designu v procesorech Ryzen, EPYC a výpočetních GPU Radeon.

Architektura a princip fungování

Místo výroby jednoho obřího monolitického křemíkového čipu (což je extrémně drahé a vykazuje vysokou zmetkovost) skládá AMD procesory z několika menších samostatných čipů (čipletů). V procesorech Ryzen se jedná o výpočetní čiplety (CCD - Core Complex Die) a centrální vstupně-výstupní čiplet (IOD - I/O Die). Infinity Fabric funguje jako extrémně rychlé a nízko-latenční „lepidlo“, které tyto čiplety navzájem propojuje.

Architektura se dělí na dvě funkční vrstvy:

Provázanost s frekvencí paměti RAM

U desktopových procesorů AMD Ryzen je taktovací frekvence vnitřní sběrnice Infinity Fabric (FCLK) standardně synchronizována s frekvencí řadiče paměti (UCLK) a reálnou frekvencí operačních pamětí DDR (MCLK). Pro dosažení nejnižší možné latence je kritické udržovat tento poměr v synchronním režimu 1:1. Při přetaktování RAM nad optimální limit dojde k rozpojení této vazby, což paradoxně sníží herní výkon kvůli penalizaci v latenci.

Výhody a limity

NVIDIA NVLink je specializované, vysokorychlostní, sériové, drátové propojovací rozhraní s podporou paměťové koherence, vyvinuté společností NVIDIA. Bylo navrženo specificky pro potřeby paralelních výpočtů, superpočítačů (HPC) a masivního trénování velkých jazykových modelů (AI / LLM).

Architektura a eliminace úzkého hrdla

V systémech s více grafickými kartami připojenými přes standardní sběrnici PCIe musí vzájemná komunikace mezi GPU často probíhat přes procesor (CPU) a systémovou RAM, což způsobuje masivní zpoždění a propady rychlosti. NVLink toto úzké hrdlo zcela odstraňuje. Umožňuje přímé spojení typu GPU-to-GPU nebo GPU-to-CPU (u procesorů NVIDIA Grace). Díky hardwarové koherenci umožňuje technologii Unified Memory – spojené grafické karty mohou sdílet své lokální paměti (VRAM) a vytvořit jeden obří, společný paměťový fond přístupný pro všechna jádra.

Ve velkých serverových sestavách (např. architektury NVIDIA DGX) je NVLink doplněn o hardwarové přepínače NVSwitch. Tyto specializované čipy na základní desce fungují jako dedikované síťové routery pro grafické karty, což umožňuje propojit desítky až stovky GPU do jedné obří výpočetní sítě, kde každá karta komunikuje s libovolnou jinou kartou plnou rychlostí bez omezení.

Generace a evoluce propustnosti

Propustnost NVLinku se udává jako celková agregovaná obousměrná šířka pásma na jeden čip:

Výhody a limity

Srovnání technologií

Vlastnost PCI Express (PCIe) AMD Infinity Fabric NVIDIA NVLink
Typ rozhraní Otevřený průmyslový standard Proprietární vnitro/mezičipový spoj Proprietární high-speed GPU propoj
Primární nasazení Připojení periferií (GPU, SSD) k CPU Propojení čipletových bloků (AMD) Propojení akcelerátorů v AI / HPC
Paměťová koherence Pouze s rozšířením CXL (PCIe 5.0+) Plná hardwarová koherence Plná hardwarová koherence
Max. propustnost (2026) ~121 GB/s (PCIe 6.0 x16) Stovky GB/s (podle verze pouzdra) Až 1,8 TB/s (NVLink 5.0 / Blackwell)
Topologie Stromová (přes Root Complex / Switche) Prstencová / Mesh (uvnitř CPU) Mesh / Plný crossbar (přes NVSwitch)
Hardwarová kompatibilita Univerzální (Intel, AMD, NVIDIA, ARM) Výhradně architektury AMD Výhradně enterprise hardware NVIDIA