====== Coordinate Networks (Implicit Neural Representations) ====== **Coordinate Networks** jsou typem neuronových sítí, které se neučí mapovat vstupy na výstupy v klasickém smyslu (např. klasifikace), ale slouží jako spojitá reprezentace objektu. Namísto ukládání obrázku jako pole pixelů se obraz uloží jako funkce $f(x, y) = \text{barva}$. Tento přístup umožňuje reprezentovat signály (obraz, zvuk, 3D tvary) s teoreticky nekonečným rozlišením, omezeným pouze kapacitou sítě. ===== Jak to funguje? ===== V tradičních reprezentacích jsou data diskrétní: * **Obraz:** Mřížka pixelů $[i, j]$. * **3D model:** Síť trojúhelníků (mesh) nebo mřížka voxelů. V **Coordinate Network** je vstupem sítě souřadnice (např. v prostoru nebo čase) a výstupem je hodnota signálu v tomto bodě: * **2D:** $(x, y) \rightarrow \text{RGB}$ * **3D:** $(x, y, z) \rightarrow \text{hustota, barva}$ (základ pro NeRF) * **Audio:** $(t) \rightarrow \text{amplituda}$ ===== Klíčové technologie a koncepty ===== ==== 1. NeRF (Neural Radiance Fields) ==== Pravděpodobně nejznámější aplikace coordinate networks. NeRF umožňuje vytvořit fotorealistickou 3D scénu z několika 2D fotografií. Síť se naučí funkci, která pro každý bod v prostoru a každý směr pohledu vrátí barvu a průhlednost. ==== 2. SIREN (Sinusoidal Representation Networks) ==== Běžné aktivační funkce (jako ReLU) nejsou vhodné pro modelování detailů (hran, textur). SIREN používá jako aktivační funkci **sinus**, což umožňuje síti přesně reprezentovat i derivace signálu (důležité pro řešení fyzikálních rovnic nebo jemné detaily povrchů). ===== Výhody a nevýhody ===== ^ Vlastnost ^ Výhoda ^ Nevýhoda ^ | **Rozlišení** | Spojité, lze vzorkovat v libovolném detailu. | Výpočetně náročné na vykreslení (nutno dotazovat síť pro každý bod). | | **Paměť** | Velmi kompaktní (miliardy pixelů nahradí pár MB parametrů). | Trénování pro každý nový objekt/scénu trvá dlouho. | | **Flexibilita** | Snadná manipulace s tvary pomocí matematických operací. | Obtížná editace konkrétních částí (změna jednoho parametru může ovlivnit celý objekt). | ===== Využití v praxi (2025-2026) ===== * **Komprese dat:** Ukládání videí nebo 3D map měst s minimálními nároky na prostor při zachování detailů. * **Medicínské zobrazování:** Rekonstrukce detailních 3D modelů orgánů z omezeného počtu rentgenových snímků. * **Herní průmysl:** Generování nekonečně detailních textur a prostředí v reálném čase bez nutnosti načítat obří texturové balíčky. --- //Související pojmy: [[hluboke_uceni|Hluboké učení]], [[neural_odes|Neural ODEs]], [[hypernetworks|Hypernetworks]], [[tsmc|TSMC]] (hardwarová akcelerace pro NeRF)//