Sběrnice a rozhraní: PCIe, Infinity Fabric a NVLink

Moderní počítačová architektura již nespoléhá pouze na syrový výkon jednotlivých jader procesoru (CPU) nebo výpočetních bloků grafických akcelerátorů (GPU). Klíčovým úzkým hrdlem (bottleneck) současných systémů je rychlost, jakou si tyto komponenty dokáží vyměňovat data. Sběrnice a propojovací rozhraní definují propustnost, latenci a topologii celého systému.

Tento článek podrobně rozebírá tři klíčové technologie: univerzální průmyslový standard PCIe, vnitročipové a mezičipové rozhraní AMD Infinity Fabric a specializovaný vysokorychlostní GPU propoj NVIDIA NVLink.

1. PCI Express (PCIe)

Peripheral Component Interconnect Express (PCIe) je celosvětový standard pro vysokorychlostní sériovou sběrnici, který slouží k připojení interních hardwarových komponent (grafické karty, NVMe SSD disky, síťové a zvukové karty) k základní desce a procesoru.

Architektura a princip fungování

Na rozdíl od starších paralelních sběrnic (PCI, PCI-X), které sdílely stejné vodiče pro všechna zařízení, využívá PCIe výhradně bod-bod (point-to-point) topologii. Každé připojené zařízení má své vlastní vyhrazené spojení s kořenovým komplexem (Root Complex) v procesoru nebo čipsetu.

Základní stavební jednotkou PCIe je linka (Lane). Jedna linka se skládá ze dvou diferenciálních párů vodičů – jeden pár pro odesílání dat (TX) a jeden pár pro příjem dat (RX), což umožňuje plně duplexní (simultánní obousměrný) provoz. Sloty na základní desce se dělí podle počtu linek:

x1: Využíváno pro zvukové karty, řadiče nebo méně náročné síťové karty.
x4 / x8: Typické pro ultra-rychlá NVMe SSD úložiště a podnikové síťové karty (10GbE+).
x16: Primární rozhraní pro herní a výpočetní grafické karty.

Generace a evoluce propustnosti

Každá nová generace PCIe přibližně zdvojnásobuje propustnost oproti té předchozí. Tento nárůst je dán zvyšováním taktovací frekvence a optimalizací kódování. Zatímco starší PCIe 2.0 využívalo kódování 8b/10b (20% režie na opravu chyb), PCIe 3.0 přešlo na efektivnější kódování 128b/130b (režie pouze 1,5 %).

Od generace PCIe 6.0 dochází k revoluční změně – namísto kódování NRZ (Non-Return-to-Zero, dva stavy 0 a 1) se přechází na signály PAM4 (Pulse Amplitude Modulation 4), které přenášejí 4 napěťové úrovně, a dokáží tak v jednom cyklu přenést dvojnásobek dat.

Následující hodnoty reprezentují teoretickou propustnost v jednom směru:

PCIe 3.0: ~0,985 GB/s na linku | ~15,75 GB/s pro slot x16
PCIe 4.0: ~1,969 GB/s na linku | ~31,51 GB/s pro slot x16
PCIe 5.0: ~3,938 GB/s na linku | ~63,02 GB/s pro slot x16
PCIe 6.0: ~7,563 GB/s na linku | ~121,01 GB/s pro slot x16

Výhody a limity

Výhody: Absolutní zpětná i dopředná kompatibilita (moderní PCIe 5.0 grafická karta bude fungovat ve staré PCIe 3.0 základní desce a naopak) a masivní podpora napříč celým trhem.
Limity: Vyšší latence způsobená komplexní vrstvenou architekturou protokolu a fyzická omezení délky tras na základní desce bez použití drahých opakovačů (redriverů).

2. AMD Infinity Fabric (IF)

AMD Infinity Fabric je proprietární systémová architektura a propojovací rozhraní vyvinuté společností AMD. Představuje klíčovou technologii, která umožnila masivní úspěch chipletového designu v procesorech Ryzen, EPYC a výpočetních GPU Radeon.

Architektura a princip fungování

Místo výroby jednoho obřího monolitického křemíkového čipu (což je extrémně drahé a vykazuje vysokou zmetkovost) skládá AMD procesory z několika menších samostatných čipů (čipletů). V procesorech Ryzen se jedná o výpočetní čiplety (CCD - Core Complex Die) a centrální vstupně-výstupní čiplet (IOD - I/O Die). Infinity Fabric funguje jako extrémně rychlé a nízko-latenční „lepidlo“, které tyto čiplety navzájem propojuje.

Architektura se dělí na dvě funkční vrstvy:

SDF (System Data Fabric): Zajišťuje přenos samotných dat mezi paměťovými řadiči, cache pamětí (L3) a výpočetními jádry. Klíčovou vlastností je udržování paměťové koherence – zajišťuje, že všechna jádra napříč všemi čiplety pracují vždy s aktuálními a stejnými daty v operační paměti.
SCF (System Control Fabric): Přenáší řídicí signály, které mají na starosti správu napájení, monitorování teplotních senzorů, řízení frekvencí (Precision Boost) a bezpečnostní protokoly.

Provázanost s frekvencí paměti RAM

U desktopových procesorů AMD Ryzen je taktovací frekvence vnitřní sběrnice Infinity Fabric (FCLK) standardně synchronizována s frekvencí řadiče paměti (UCLK) a reálnou frekvencí operačních pamětí DDR (MCLK). Pro dosažení nejnižší možné latence je kritické udržovat tento poměr v synchronním režimu 1:1. Při přetaktování RAM nad optimální limit dojde k rozpojení této vazby, což paradoxně sníží herní výkon kvůli penalizaci v latenci.

Výhody a limity

Výhody: Obrovská flexibilita výroby (AMD může kombinovat různé výrobní procesy pro výpočetní čipy a I/O čipy), snadná škálovatelnost až na 128 a více jader v jednom procesorovém pouzdře.
Limity: Komunikace mezi jádry na různých čipletech (inter-CCD) vykazuje prokazatelně vyšší latenci než komunikace v rámci jednoho čipletu (intra-CCD).

3. NVIDIA NVLink

NVIDIA NVLink je specializované, vysokorychlostní, sériové, drátové propojovací rozhraní s podporou paměťové koherence, vyvinuté společností NVIDIA. Bylo navrženo specificky pro potřeby paralelních výpočtů, superpočítačů (HPC) a masivního trénování velkých jazykových modelů (AI / LLM).

Architektura a eliminace úzkého hrdla

V systémech s více grafickými kartami připojenými přes standardní sběrnici PCIe musí vzájemná komunikace mezi GPU často probíhat přes procesor (CPU) a systémovou RAM, což způsobuje masivní zpoždění a propady rychlosti. NVLink toto úzké hrdlo zcela odstraňuje. Umožňuje přímé spojení typu GPU-to-GPU nebo GPU-to-CPU (u procesorů NVIDIA Grace). Díky hardwarové koherenci umožňuje technologii Unified Memory – spojené grafické karty mohou sdílet své lokální paměti (VRAM) a vytvořit jeden obří, společný paměťový fond přístupný pro všechna jádra.

Ve velkých serverových sestavách (např. architektury NVIDIA DGX) je NVLink doplněn o hardwarové přepínače NVSwitch. Tyto specializované čipy na základní desce fungují jako dedikované síťové routery pro grafické karty, což umožňuje propojit desítky až stovky GPU do jedné obří výpočetní sítě, kde každá karta komunikuje s libovolnou jinou kartou plnou rychlostí bez omezení.

Generace a evoluce propustnosti

Propustnost NVLinku se udává jako celková agregovaná obousměrná šířka pásma na jeden čip:

NVLink 1.0 (architektura Pascal): Agregovaná propustnost až 160 GB/s.
NVLink 2.0 (architektura Volta): Agregovaná propustnost až 300 GB/s.
NVLink 3.0 (architektura Ampere): Agregovaná propustnost až 600 GB/s.
NVLink 4.0 (architektura Hopper): Agregovaná propustnost až 900 GB/s.
NVLink 5.0 (architektura Blackwell): Extrémní posun na hranici až 1,8 TB/s (1800 GB/s) na jedno GPU.

Výhody a limity

Výhody: Brutální přenosová rychlost, která řádově překonává možnosti PCIe, extrémně nízká latence na úrovni hardwarových registrů, nezbytnost pro moderní AI superpočítače.
Limity: Extrémně vysoká pořizovací cena, stoprocentní proprietární uzavřenost (technologie funguje výhradně s vybraným podnikovým hardwarem NVIDIA).

Srovnání technologií

Vlastnost	PCI Express (PCIe)	AMD Infinity Fabric	NVIDIA NVLink
Typ rozhraní	Otevřený průmyslový standard	Proprietární vnitro/mezičipový spoj	Proprietární high-speed GPU propoj
Primární nasazení	Připojení periferií (GPU, SSD) k CPU	Propojení čipletových bloků (AMD)	Propojení akcelerátorů v AI / HPC
Paměťová koherence	Pouze s rozšířením CXL (PCIe 5.0+)	Plná hardwarová koherence	Plná hardwarová koherence
Max. propustnost (2026)	~121 GB/s (PCIe 6.0 x16)	Stovky GB/s (podle verze pouzdra)	Až 1,8 TB/s (NVLink 5.0 / Blackwell)
Topologie	Stromová (přes Root Complex / Switche)	Prstencová / Mesh (uvnitř CPU)	Mesh / Plný crossbar (přes NVSwitch)
Hardwarová kompatibilita	Univerzální (Intel, AMD, NVIDIA, ARM)	Výhradně architektury AMD	Výhradně enterprise hardware NVIDIA