UTF je rodina standardů pro kódování znaků, která umožňuje reprezentovat jakýkoliv znak z mezinárodní sady Unicode (včetně české diakritiky, azbuky, čínských znaků nebo emoji) v digitální podobě. Díky UTF můžeme v našich systémech bezpečně pracovat s textem v jakémkoliv jazyce bez rizika vzniku nečitelných znaků (tzv. „rozsypaný čaj“).
Nejpoužívanější formát v naší společnosti a na celém internetu.
Znaky jsou kódovány primárně pomocí 2 nebo 4 bajtů.
Správné nastavení UTF kódování zajišťuje:
Aby naše IT Podpora předešla problémům s kódováním, dodržujeme tato pravidla:
1. **"UTF-8 Everywhere":** Všechny nové databáze a textové soubory musí být standardně ukládány v kódování **UTF-8 bez BOM**. 2. **HTTP hlavičky:** Naše webové servery musí vždy odesílat hlavičku `Content-Type: text/html; charset=utf-8`. 3. **API komunikace:** Veškerá výměna dat mezi mikroslužbami v našem **[[VPC]]** probíhá výhradně v UTF-8.
Pokud narazíte na špatné zobrazení znaků (např. „“ nebo „á“):
Poznámka pro vývojáře: Při práci s databázemi vždy nastavte `character_set_server` na `utf8mb4`, což je vylepšená verze UTF-8 podporující i nejnovější sady emoji a historických symbolů.
— Související stránky: ZIF, WWW, VPS, VPC, VCS, Vývojový tým, IT Podpora, Marketingové oddělení