====== ChatGPT ====== ChatGPT (Chat Generative Pre-trained Transformer) je pokročilý chatbot a asistent založený na velkém jazykovém modelu ([[llm|LLM]]) vyvinutý výzkumnou společností OpenAI. Od svého uvedení v listopadu 2022 (kdy dosáhl 100 milionů uživatelů za pouhé dva měsíce) způsobil absolutní revoluci v tom, jak lidé a firmy interagují s počítači, generují text, programují, analyzují data a vyhledávají informace. Z technického hlediska nejde o klasický "vyhledávač" ani databázi faktů, ale o vysoce komplexní stochastický prediktivní model, který na základě rozsáhlého kontextu matematicky odhaduje nejpravděpodobnější následující část slova (tzv. token). {{ :chatgpt.png}} Webové okno Chatgpt k 10. 6. 2026 ===== Architektura a fungování ===== ChatGPT stojí na několika klíčových technologických konceptech a pilířích: ==== 1. Transformer ==== Jde o přelomový typ architektury [[hluboke_uceni|hlubokého učení]] (představený společností Google v roce 2017), která využívá mechanismus pozornosti (Self-Attention). To umožňuje modelu chápat vztahy mezi slovy v dlouhých větách, i když jsou od sebe daleko (např. shoda podmětu s přísudkem napříč celým odstavcem) a zpracovávat text paralelně, na rozdíl od starších RNN modelů. ==== 2. Tokenizace ==== Model nečte text po slovech, ale po tzv. tokenech. Token může být celé slovo (např. "pes"), ale i část slova nebo jen jeden znak (typické pro češtinu a složitější jazyky). 100 tokenů odpovídá zhruba 75 slovům v angličtině. Omezená "paměť" modelu v jedné konverzaci se nazývá Context Window (kontextové okno) a u nejnovějších modelů dosahuje až 128 000 (nebo i více) tokenů, což je ekvivalent celé knihy. ==== 3. Generative Pre-training (Předtrénování) ==== Model byl nejprve trénován (tzv. unsupervised learning) na obrovském clusteru GPU od společnosti [[nvidia|NVIDIA]] na masivním množství textových dat z internetu (knihy, články, kód, fóra). Během této fáze si vytvořil vnitřní reprezentaci světa, naučil se gramatiku, programovací jazyky, fakta i různé styly psaní. ==== 4. RLHF (Reinforcement Learning from Human Feedback) ==== Klíčový krok (tzv. alignment), který udělal z "naivního doplňovače textu" užitečného a bezpečného pomocníka. Lidé hodnotili odpovědi modelu a přidělovali jim skóre, čímž ho učili: Odpovídat strukturovaně, slušně a bezpečně. Pečlivě dodržovat instrukce uživatele (tzv. system prompt). Přiznat chybu nebo odmítnout nevhodný dotaz (např. generování malwaru nebo nenávistného obsahu). ==== 5. MoE (Mixture of Experts) ==== Od verze GPT-4 model pravděpodobně nevyužívá jednu gigantickou neuronovou síť pro každý dotaz, ale architekturu "směsi expertů". Model se skládá z několika menších podsítí (expertů) a při každém dotazu se aktivují jen ty relevantní (např. expert na Python, expert na historii). To dramaticky snižuje výpočetní nároky (inference) při zachování obrovského počtu parametrů. ===== Ekosystém a podnikové integrace ===== Dnes již ChatGPT není jen textové okno, ale komplexní platforma: API a Function Calling: Vývojáři mohou modely integrovat do vlastních aplikací. Model umí nejen odpovídat textem, ale umí zavolat externí funkci (API), např. zjistit aktuální počasí, provést SQL dotaz do databáze nebo založit tiket v Jira, a výsledek zpracovat. Custom GPTs: Uživatelé si mohou vytvářet vlastní verze ChatGPT, kterým nahrají specifická data (např. interní manuály firmy) a dají jim specifické instrukce (např. "chovej se jako seniorní Linux administrátor"). Advanced Data Analysis (Code Interpreter): ChatGPT má k dispozici virtuální prostředí (sandbox), kde dokáže sám psát a spouštět Python kód. Díky tomu umí analyzovat nahrané Excel tabulky, generovat grafy, konvertovat soubory nebo řešit složité matematické úlohy. RAG (Retrieval-Augmented Generation): Klíčová technologie pro podnikovou sféru. ChatGPT nemá v parametrech aktuální data firmy, ale RAG mu umožňuje nejprve vyhledat relevantní dokumenty v podnikové databázi a teprve na jejich základě vygenerovat přesnou odpověď. ===== Vývoj verzí modelu ===== OpenAI modely neustále iteruje. Trénink i běh (inference) vyžaduje extrémně výkonný hardware (AI akcelerátory, např. řady H100 a B200), nejčastěji vyráběný v továrnách [[tsmc|TSMC]]. ^ Verze modelu ^ Hlavní přínos a charakteristika ^ | GPT-3.5 | Původní verze dostupná zdarma. Rychlá, ale s omezeným logickým uvažováním a menším kontextovým oknem. Dnes již považována za zastaralou (legacy). | | GPT-4 | První multimodální model s vysokou přesností. Výrazně lepší v programování, logice a chápání složitého kontextu. Průlomový pro firemní nasazení. | | GPT-4 Turbo | Rychlejší, levnější pro API, s kontextovým oknem 128k tokenů (cca 300 stran textu) a aktuálnějšími daty. | | GPT-4o (Omni) | Nativně multimodální. Zpracovává text, zvuk i obraz současně a v reálném čase. Umožňuje plynulou hlasovou konverzaci s přirozenou intonací a nulovým zpožděním (reaguje jako člověk na telefonu). | | OpenAI o1 / o1-mini | Zásadní změna paradigmatu. Tzv. Reasoning models. Před vygenerováním odpovědi "přemýšlejí" (skrytý Chain of Thought). Jsou mnohem pomalejší, ale extrémně schopné v řešení komplexních programátorských, matematických a vědeckých úloh, kde GPT-4o selhává. | ===== Omezení a rizika ===== Nasazení ChatGPT v praxi nese řadu výzev, na které musí IT oddělení pamatovat: Halucinace (Konfabulace): Model může s naprostou jistotou tvrdit věc, která není pravdivá. Neví, co neví, a raději si vymyslí přesvědčivě znějící nesmysl (např. neexistující příkaz v Linuxu nebo fiktivní judikát). Znalostní cutoff a temporalita: Modely mají konkrétní datum, po kterém už nebyly trénovány. Přístup k internetu to částečně řeší, ale nativní znalosti jsou omezené. Ochrana soukromí a únik dat (Data Leakage): Data vložená do běžné, neplacené verze chatu mohou být použita k dalšímu trénování (slavný je případ, kdy vývojáři Samsungu nechtěně nahráli do ChatGPT tajný zdrojový kód). Řešením je ChatGPT Enterprise / Team, kde OpenAI garantuje, že data pro trénink nevyužije. Prompt Injection (Jailbreaking): Bezpečnostní zranitelnost, kdy útočník pomocí speciálně navrženého vstupu přesvědčí model, aby ignoroval své původní instrukce a prozradil tajné informace nebo vygeneroval škodlivý obsah. Autorská práva: Probíhají desítky soudních sporů (např. The New York Times vs. OpenAI) o to, zda trénink modelu na datech chráněných autorským právem splňuje definici "Fair Use". Ekologická stopa: Trénink a samotný běh modelů vyžaduje obrovské množství elektřiny a vody na chlazení datacenter. ===== Význam pro IT průmysl ===== ChatGPT a jeho API zcela redefinovaly roli IT profesionálů: Software Engineering & DevOps: Nástroje jako GitHub Copilot nebo Cursor (založené na LLM) generují boilerplate kód, píší testy, hledají bugy a navrhují refaktoring. Vývojář se stává spíše "architektem" a "revizorem" kódu. Kybernetická bezpečnost: Generativní AI dokáže rychle analyzovat obrovské logy ze SIEM systémů, psát YARA pravidla a vysvětlovat deobfuskovaný malware. Útočníci ji naopak využívají k tvorbě vysoce personalizovaných phishingových e-mailů. Zákaznická podpora a IT Helpdesk: Inteligentní asistenti na první linii podpory, kteří s využitím RAG prohledávají interní Knowledge Base (např. Confluence) a radí uživatelům s běžnými IT problémy dříve, než se tiket dostane k živému operátorovi. Vznik nových rolí: Do popředí se dostává [[prompt_engineering|Prompt Engineering]] (umění správně psát zadání pro AI) a AI Integrator (specialista na propojování firemních systémů s LLM modely). ===== Hlavní konkurenti na trhu ===== ChatGPT nezůstal osamocen. Současný trh LLM zahrnuje silné alternativy: Claude (Anthropic): Považován za bezpečnější, s lepším a "lidštějším" stylem psaní, vynikající pro programování (Claude 3.5 Sonnet). Gemini (Google): Hluboce integrovaný do ekosystému Google (Workspace, Cloud). Llama (Meta/Facebook): Nejsilnější open-weight (volně dostupný) model, který si firmy mohou stáhnout a provozovat na vlastních serverech s absolutní kontrolou nad daty (On-Premise). //Související pojmy: [[llm|LLM (Large Language Model)]], [[hluboke_uceni|Hluboké učení]], [[rag|RAG]], [[prompt_engineering|Prompt Engineering]], [[soc|SoC]], [[tsmc|TSMC]], [[nvidia|NVIDIA]], [[broadcom|Broadcom]] (síťové prvky pro AI)//