====== ChatGPT ======

ChatGPT (Chat Generative Pre-trained Transformer) je pokročilý chatbot a asistent založený na velkém jazykovém modelu ([[llm|LLM]]) vyvinutý výzkumnou společností OpenAI. Od svého uvedení v listopadu 2022 (kdy dosáhl 100 milionů uživatelů za pouhé dva měsíce) způsobil absolutní revoluci v tom, jak lidé a firmy interagují s počítači, generují text, programují, analyzují data a vyhledávají informace.

Z technického hlediska nejde o klasický "vyhledávač" ani databázi faktů, ale o vysoce komplexní stochastický prediktivní model, který na základě rozsáhlého kontextu matematicky odhaduje nejpravděpodobnější následující část slova (tzv. token).
{{ :chatgpt.png}}
Webové okno Chatgpt k 10. 6. 2026
===== Architektura a fungování =====

ChatGPT stojí na několika klíčových technologických konceptech a pilířích:

==== 1. Transformer ====
Jde o přelomový typ architektury [[hluboke_uceni|hlubokého učení]] (představený společností Google v roce 2017), která využívá mechanismus pozornosti (Self-Attention). To umožňuje modelu chápat vztahy mezi slovy v dlouhých větách, i když jsou od sebe daleko (např. shoda podmětu s přísudkem napříč celým odstavcem) a zpracovávat text paralelně, na rozdíl od starších RNN modelů.

==== 2. Tokenizace ====
Model nečte text po slovech, ale po tzv. tokenech. Token může být celé slovo (např. "pes"), ale i část slova nebo jen jeden znak (typické pro češtinu a složitější jazyky). 100 tokenů odpovídá zhruba 75 slovům v angličtině. Omezená "paměť" modelu v jedné konverzaci se nazývá Context Window (kontextové okno) a u nejnovějších modelů dosahuje až 128 000 (nebo i více) tokenů, což je ekvivalent celé knihy.

==== 3. Generative Pre-training (Předtrénování) ====
Model byl nejprve trénován (tzv. unsupervised learning) na obrovském clusteru GPU od společnosti [[nvidia|NVIDIA]] na masivním množství textových dat z internetu (knihy, články, kód, fóra). Během této fáze si vytvořil vnitřní reprezentaci světa, naučil se gramatiku, programovací jazyky, fakta i různé styly psaní.

==== 4. RLHF (Reinforcement Learning from Human Feedback) ====
Klíčový krok (tzv. alignment), který udělal z "naivního doplňovače textu" užitečného a bezpečného pomocníka. Lidé hodnotili odpovědi modelu a přidělovali jim skóre, čímž ho učili:

Odpovídat strukturovaně, slušně a bezpečně.

Pečlivě dodržovat instrukce uživatele (tzv. system prompt).

Přiznat chybu nebo odmítnout nevhodný dotaz (např. generování malwaru nebo nenávistného obsahu).

==== 5. MoE (Mixture of Experts) ====
Od verze GPT-4 model pravděpodobně nevyužívá jednu gigantickou neuronovou síť pro každý dotaz, ale architekturu "směsi expertů". Model se skládá z několika menších podsítí (expertů) a při každém dotazu se aktivují jen ty relevantní (např. expert na Python, expert na historii). To dramaticky snižuje výpočetní nároky (inference) při zachování obrovského počtu parametrů.

===== Ekosystém a podnikové integrace =====

Dnes již ChatGPT není jen textové okno, ale komplexní platforma:

API a Function Calling: Vývojáři mohou modely integrovat do vlastních aplikací. Model umí nejen odpovídat textem, ale umí zavolat externí funkci (API), např. zjistit aktuální počasí, provést SQL dotaz do databáze nebo založit tiket v Jira, a výsledek zpracovat.

Custom GPTs: Uživatelé si mohou vytvářet vlastní verze ChatGPT, kterým nahrají specifická data (např. interní manuály firmy) a dají jim specifické instrukce (např. "chovej se jako seniorní Linux administrátor").

Advanced Data Analysis (Code Interpreter): ChatGPT má k dispozici virtuální prostředí (sandbox), kde dokáže sám psát a spouštět Python kód. Díky tomu umí analyzovat nahrané Excel tabulky, generovat grafy, konvertovat soubory nebo řešit složité matematické úlohy.

RAG (Retrieval-Augmented Generation): Klíčová technologie pro podnikovou sféru. ChatGPT nemá v parametrech aktuální data firmy, ale RAG mu umožňuje nejprve vyhledat relevantní dokumenty v podnikové databázi a teprve na jejich základě vygenerovat přesnou odpověď.

===== Vývoj verzí modelu =====

OpenAI modely neustále iteruje. Trénink i běh (inference) vyžaduje extrémně výkonný hardware (AI akcelerátory, např. řady H100 a B200), nejčastěji vyráběný v továrnách [[tsmc|TSMC]].

^ Verze modelu ^ Hlavní přínos a charakteristika ^
| GPT-3.5 | Původní verze dostupná zdarma. Rychlá, ale s omezeným logickým uvažováním a menším kontextovým oknem. Dnes již považována za zastaralou (legacy). |
| GPT-4 | První multimodální model s vysokou přesností. Výrazně lepší v programování, logice a chápání složitého kontextu. Průlomový pro firemní nasazení. |
| GPT-4 Turbo | Rychlejší, levnější pro API, s kontextovým oknem 128k tokenů (cca 300 stran textu) a aktuálnějšími daty. |
| GPT-4o (Omni) | Nativně multimodální. Zpracovává text, zvuk i obraz současně a v reálném čase. Umožňuje plynulou hlasovou konverzaci s přirozenou intonací a nulovým zpožděním (reaguje jako člověk na telefonu). |
| OpenAI o1 / o1-mini | Zásadní změna paradigmatu. Tzv. Reasoning models. Před vygenerováním odpovědi "přemýšlejí" (skrytý Chain of Thought). Jsou mnohem pomalejší, ale extrémně schopné v řešení komplexních programátorských, matematických a vědeckých úloh, kde GPT-4o selhává. |

===== Omezení a rizika =====

Nasazení ChatGPT v praxi nese řadu výzev, na které musí IT oddělení pamatovat:

Halucinace (Konfabulace): Model může s naprostou jistotou tvrdit věc, která není pravdivá. Neví, co neví, a raději si vymyslí přesvědčivě znějící nesmysl (např. neexistující příkaz v Linuxu nebo fiktivní judikát).

Znalostní cutoff a temporalita: Modely mají konkrétní datum, po kterém už nebyly trénovány. Přístup k internetu to částečně řeší, ale nativní znalosti jsou omezené.

Ochrana soukromí a únik dat (Data Leakage): Data vložená do běžné, neplacené verze chatu mohou být použita k dalšímu trénování (slavný je případ, kdy vývojáři Samsungu nechtěně nahráli do ChatGPT tajný zdrojový kód). Řešením je ChatGPT Enterprise / Team, kde OpenAI garantuje, že data pro trénink nevyužije.

Prompt Injection (Jailbreaking): Bezpečnostní zranitelnost, kdy útočník pomocí speciálně navrženého vstupu přesvědčí model, aby ignoroval své původní instrukce a prozradil tajné informace nebo vygeneroval škodlivý obsah.

Autorská práva: Probíhají desítky soudních sporů (např. The New York Times vs. OpenAI) o to, zda trénink modelu na datech chráněných autorským právem splňuje definici "Fair Use".

Ekologická stopa: Trénink a samotný běh modelů vyžaduje obrovské množství elektřiny a vody na chlazení datacenter.

===== Význam pro IT průmysl =====

ChatGPT a jeho API zcela redefinovaly roli IT profesionálů:

Software Engineering & DevOps: Nástroje jako GitHub Copilot nebo Cursor (založené na LLM) generují boilerplate kód, píší testy, hledají bugy a navrhují refaktoring. Vývojář se stává spíše "architektem" a "revizorem" kódu.

Kybernetická bezpečnost: Generativní AI dokáže rychle analyzovat obrovské logy ze SIEM systémů, psát YARA pravidla a vysvětlovat deobfuskovaný malware. Útočníci ji naopak využívají k tvorbě vysoce personalizovaných phishingových e-mailů.

Zákaznická podpora a IT Helpdesk: Inteligentní asistenti na první linii podpory, kteří s využitím RAG prohledávají interní Knowledge Base (např. Confluence) a radí uživatelům s běžnými IT problémy dříve, než se tiket dostane k živému operátorovi.

Vznik nových rolí: Do popředí se dostává [[prompt_engineering|Prompt Engineering]] (umění správně psát zadání pro AI) a AI Integrator (specialista na propojování firemních systémů s LLM modely).

===== Hlavní konkurenti na trhu =====
ChatGPT nezůstal osamocen. Současný trh LLM zahrnuje silné alternativy:

Claude (Anthropic): Považován za bezpečnější, s lepším a "lidštějším" stylem psaní, vynikající pro programování (Claude 3.5 Sonnet).

Gemini (Google): Hluboce integrovaný do ekosystému Google (Workspace, Cloud).

Llama (Meta/Facebook): Nejsilnější open-weight (volně dostupný) model, který si firmy mohou stáhnout a provozovat na vlastních serverech s absolutní kontrolou nad daty (On-Premise).

//Související pojmy: [[llm|LLM (Large Language Model)]], [[hluboke_uceni|Hluboké učení]], [[rag|RAG]], [[prompt_engineering|Prompt Engineering]], [[soc|SoC]], [[tsmc|TSMC]], [[nvidia|NVIDIA]], [[broadcom|Broadcom]] (síťové prvky pro AI)//