ChatGPT (Chat Generative Pre-trained Transformer) je pokročilý chatbot a asistent založený na velkém jazykovém modelu (LLM) vyvinutý výzkumnou společností OpenAI. Od svého uvedení v listopadu 2022 (kdy dosáhl 100 milionů uživatelů za pouhé dva měsíce) způsobil absolutní revoluci v tom, jak lidé a firmy interagují s počítači, generují text, programují, analyzují data a vyhledávají informace.
Z technického hlediska nejde o klasický „vyhledávač“ ani databázi faktů, ale o vysoce komplexní stochastický prediktivní model, který na základě rozsáhlého kontextu matematicky odhaduje nejpravděpodobnější následující část slova (tzv. token).
Webové okno Chatgpt k 10. 6. 2026
ChatGPT stojí na několika klíčových technologických konceptech a pilířích:
Jde o přelomový typ architektury hlubokého učení (představený společností Google v roce 2017), která využívá mechanismus pozornosti (Self-Attention). To umožňuje modelu chápat vztahy mezi slovy v dlouhých větách, i když jsou od sebe daleko (např. shoda podmětu s přísudkem napříč celým odstavcem) a zpracovávat text paralelně, na rozdíl od starších RNN modelů.
Model nečte text po slovech, ale po tzv. tokenech. Token může být celé slovo (např. „pes“), ale i část slova nebo jen jeden znak (typické pro češtinu a složitější jazyky). 100 tokenů odpovídá zhruba 75 slovům v angličtině. Omezená „paměť“ modelu v jedné konverzaci se nazývá Context Window (kontextové okno) a u nejnovějších modelů dosahuje až 128 000 (nebo i více) tokenů, což je ekvivalent celé knihy.
Model byl nejprve trénován (tzv. unsupervised learning) na obrovském clusteru GPU od společnosti NVIDIA na masivním množství textových dat z internetu (knihy, články, kód, fóra). Během této fáze si vytvořil vnitřní reprezentaci světa, naučil se gramatiku, programovací jazyky, fakta i různé styly psaní.
Klíčový krok (tzv. alignment), který udělal z „naivního doplňovače textu“ užitečného a bezpečného pomocníka. Lidé hodnotili odpovědi modelu a přidělovali jim skóre, čímž ho učili:
Odpovídat strukturovaně, slušně a bezpečně.
Pečlivě dodržovat instrukce uživatele (tzv. system prompt).
Přiznat chybu nebo odmítnout nevhodný dotaz (např. generování malwaru nebo nenávistného obsahu).
Od verze GPT-4 model pravděpodobně nevyužívá jednu gigantickou neuronovou síť pro každý dotaz, ale architekturu „směsi expertů“. Model se skládá z několika menších podsítí (expertů) a při každém dotazu se aktivují jen ty relevantní (např. expert na Python, expert na historii). To dramaticky snižuje výpočetní nároky (inference) při zachování obrovského počtu parametrů.
Dnes již ChatGPT není jen textové okno, ale komplexní platforma:
API a Function Calling: Vývojáři mohou modely integrovat do vlastních aplikací. Model umí nejen odpovídat textem, ale umí zavolat externí funkci (API), např. zjistit aktuální počasí, provést SQL dotaz do databáze nebo založit tiket v Jira, a výsledek zpracovat.
Custom GPTs: Uživatelé si mohou vytvářet vlastní verze ChatGPT, kterým nahrají specifická data (např. interní manuály firmy) a dají jim specifické instrukce (např. „chovej se jako seniorní Linux administrátor“).
Advanced Data Analysis (Code Interpreter): ChatGPT má k dispozici virtuální prostředí (sandbox), kde dokáže sám psát a spouštět Python kód. Díky tomu umí analyzovat nahrané Excel tabulky, generovat grafy, konvertovat soubory nebo řešit složité matematické úlohy.
RAG (Retrieval-Augmented Generation): Klíčová technologie pro podnikovou sféru. ChatGPT nemá v parametrech aktuální data firmy, ale RAG mu umožňuje nejprve vyhledat relevantní dokumenty v podnikové databázi a teprve na jejich základě vygenerovat přesnou odpověď.
OpenAI modely neustále iteruje. Trénink i běh (inference) vyžaduje extrémně výkonný hardware (AI akcelerátory, např. řady H100 a B200), nejčastěji vyráběný v továrnách TSMC.
| Verze modelu | Hlavní přínos a charakteristika |
|---|---|
| GPT-3.5 | Původní verze dostupná zdarma. Rychlá, ale s omezeným logickým uvažováním a menším kontextovým oknem. Dnes již považována za zastaralou (legacy). |
| GPT-4 | První multimodální model s vysokou přesností. Výrazně lepší v programování, logice a chápání složitého kontextu. Průlomový pro firemní nasazení. |
| GPT-4 Turbo | Rychlejší, levnější pro API, s kontextovým oknem 128k tokenů (cca 300 stran textu) a aktuálnějšími daty. |
| GPT-4o (Omni) | Nativně multimodální. Zpracovává text, zvuk i obraz současně a v reálném čase. Umožňuje plynulou hlasovou konverzaci s přirozenou intonací a nulovým zpožděním (reaguje jako člověk na telefonu). |
| OpenAI o1 / o1-mini | Zásadní změna paradigmatu. Tzv. Reasoning models. Před vygenerováním odpovědi „přemýšlejí“ (skrytý Chain of Thought). Jsou mnohem pomalejší, ale extrémně schopné v řešení komplexních programátorských, matematických a vědeckých úloh, kde GPT-4o selhává. |
Nasazení ChatGPT v praxi nese řadu výzev, na které musí IT oddělení pamatovat:
Halucinace (Konfabulace): Model může s naprostou jistotou tvrdit věc, která není pravdivá. Neví, co neví, a raději si vymyslí přesvědčivě znějící nesmysl (např. neexistující příkaz v Linuxu nebo fiktivní judikát).
Znalostní cutoff a temporalita: Modely mají konkrétní datum, po kterém už nebyly trénovány. Přístup k internetu to částečně řeší, ale nativní znalosti jsou omezené.
Ochrana soukromí a únik dat (Data Leakage): Data vložená do běžné, neplacené verze chatu mohou být použita k dalšímu trénování (slavný je případ, kdy vývojáři Samsungu nechtěně nahráli do ChatGPT tajný zdrojový kód). Řešením je ChatGPT Enterprise / Team, kde OpenAI garantuje, že data pro trénink nevyužije.
Prompt Injection (Jailbreaking): Bezpečnostní zranitelnost, kdy útočník pomocí speciálně navrženého vstupu přesvědčí model, aby ignoroval své původní instrukce a prozradil tajné informace nebo vygeneroval škodlivý obsah.
Autorská práva: Probíhají desítky soudních sporů (např. The New York Times vs. OpenAI) o to, zda trénink modelu na datech chráněných autorským právem splňuje definici „Fair Use“.
Ekologická stopa: Trénink a samotný běh modelů vyžaduje obrovské množství elektřiny a vody na chlazení datacenter.
ChatGPT a jeho API zcela redefinovaly roli IT profesionálů:
Software Engineering & DevOps: Nástroje jako GitHub Copilot nebo Cursor (založené na LLM) generují boilerplate kód, píší testy, hledají bugy a navrhují refaktoring. Vývojář se stává spíše „architektem“ a „revizorem“ kódu.
Kybernetická bezpečnost: Generativní AI dokáže rychle analyzovat obrovské logy ze SIEM systémů, psát YARA pravidla a vysvětlovat deobfuskovaný malware. Útočníci ji naopak využívají k tvorbě vysoce personalizovaných phishingových e-mailů.
Zákaznická podpora a IT Helpdesk: Inteligentní asistenti na první linii podpory, kteří s využitím RAG prohledávají interní Knowledge Base (např. Confluence) a radí uživatelům s běžnými IT problémy dříve, než se tiket dostane k živému operátorovi.
Vznik nových rolí: Do popředí se dostává Prompt Engineering (umění správně psát zadání pro AI) a AI Integrator (specialista na propojování firemních systémů s LLM modely).
ChatGPT nezůstal osamocen. Současný trh LLM zahrnuje silné alternativy:
Claude (Anthropic): Považován za bezpečnější, s lepším a „lidštějším“ stylem psaní, vynikající pro programování (Claude 3.5 Sonnet).
Gemini (Google): Hluboce integrovaný do ekosystému Google (Workspace, Cloud).
Llama (Meta/Facebook): Nejsilnější open-weight (volně dostupný) model, který si firmy mohou stáhnout a provozovat na vlastních serverech s absolutní kontrolou nad daty (On-Premise).
Související pojmy: LLM (Large Language Model), Hluboké učení, RAG, Prompt Engineering, SoC, TSMC, NVIDIA, Broadcom (síťové prvky pro AI)