Obsah

UTF (Unicode Transformation Format)

UTF je rodina standardů pro kódování znaků, která umožňuje reprezentovat jakýkoliv znak z mezinárodní sady Unicode (včetně české diakritiky, azbuky, čínských znaků nebo emoji) v digitální podobě. Díky UTF můžeme v našich systémech bezpečně pracovat s textem v jakémkoliv jazyce bez rizika vzniku nečitelných znaků (tzv. „rozsypaný čaj“).

Formáty UTF používané v naší síti

1. UTF-8

Nejpoužívanější formát v naší společnosti a na celém internetu.

2. UTF-16

Znaky jsou kódovány primárně pomocí 2 nebo 4 bajtů.

Proč je UTF klíčové pro naše systémy?

Správné nastavení UTF kódování zajišťuje:

Správa a konfigurace (Best Practices)

Aby naše IT Podpora předešla problémům s kódováním, dodržujeme tato pravidla:

1. **"UTF-8 Everywhere":** Všechny nové databáze a textové soubory musí být standardně ukládány v kódování **UTF-8 bez BOM**.
2. **HTTP hlavičky:** Naše webové servery musí vždy odesílat hlavičku `Content-Type: text/html; charset=utf-8`.
3. **API komunikace:** Veškerá výměna dat mezi mikroslužbami v našem **[[VPC]]** probíhá výhradně v UTF-8.

Časté problémy a řešení

Pokud narazíte na špatné zobrazení znaků (např. „“ nebo „á“):

Poznámka pro vývojáře: Při práci s databázemi vždy nastavte `character_set_server` na `utf8mb4`, což je vylepšená verze UTF-8 podporující i nejnovější sady emoji a historických symbolů.

Související stránky: ZIF, WWW, VPS, VPC, VCS, Vývojový tým, IT Podpora, Marketingové oddělení