Proč GPT-4 v korporátu naráží na skleněný strop

Konec drahého blábolení: Proč firmy vyměňují obří LLM za armádu malých agentů (a jak na tom vydělat)

Pamatujete si na ten velkolepý slib, že nám ChatGPT nahradí celé oddělení zákaznické podpory a napíše kód za deset seniorních vývojářů? Realita je zatím taková, že většina firem skončila s předraženým oknem pro chat, které sice umí hezky básnit o firemní vizi, ale když po něm chcete, aby skutečně vyřídilo reklamaci nebo zoptimalizovalo nákup elektřiny na spotovém trhu, začne si vymýšlet nesmysly. Fiasko rakety New Glenn od Blue Origin, která nedávno utrpěla kritické selhání při testech, je pro svět AI dokonalou metaforou. Můžete mít největší motor na světě a miliardy v rozpočtu, ale pokud vám selže logika řízení v kritický moment, máte jen hromadu drahého šrotu. V podnikovém nasazení AI jsme právě v této fázi: máme obří "motory" (LLM), ale chybí nám pilot, který ví, kdy přidat plyn a kdy ubrat.

Proč GPT-4 v korporátu naráží na skleněný strop

Většina manažerů si myslí, že čím víc parametrů model má, tím je chytřejší. Je to stejný omyl jako si myslet, že čím větší má auto motor, tím rychleji vás doveze v pražské zácpě. Obří modely jako GPT-4 jsou fantastické pro kreativní psaní nebo brainstorming, ale pro "údržbu" firemních procesů jsou neohrabané, pomalé a neuvěřitelně drahé. Jeden prompt vás může stát i několik korun a odpověď trvá věčnost. Navíc, LLM jsou ze své podstaty "bezpaměťové". Každý dotaz je pro ně nový začátek.

Skutečný průlom pro rok 2026 není GPT-5, ale modely jako Mellum2 od JetBrains. Tenhle 12B Mixture-of-Experts (MoE) kousek ukazuje směr, kudy se vydat. Místo jednoho monstra, které ví všechno (a nic pořádně), máme architekturu, která aktivuje jen ty části mozku, které zrovna potřebuje. Je to efektivní, rychlé a dá se to provozovat lokálně. Ve firemním prostředí totiž nepotřebujete, aby AI věděla, kdo vyhrál Wimbledon v roce 1984. Potřebujete, aby uměla přečíst logy z vašeho CRM, porovnat je s fakturou v PDF a poslat upozornění do Slacku, že zákazník přeplácí. A na to nepotřebujete 175 miliard parametrů. Potřebujete agentní logiku.

Agentní logika: Když AI přestane mluvit a začne makat

Rozdíl mezi LLM a AI agentem je jako rozdíl mezi kuchařkou a kuchařem. Kuchařka (LLM) vám řekne recept na svíčkovou. Kuchař (Agent) si vezme nůž, nakrájí maso, zapne sporák a tu svíčkovou vám uvaří. Agentní logika znamená, že model nedostává jen textové zadání, ale má k dispozici nástroje (nástroje pro zápis do databáze, přístup k API, terminál).

V praxi to vypadá tak, že agentovi řeknete: „Zkontroluj spotřebu v našem skladu a pokud cena elektřiny na OTE klesne pod 50 EUR/MWh, začni nabíjet baterie.“ Agent nejdříve použije model k pochopení věty, pak zavolá API operátora trhu, zkontroluje stav nabití vašeho BESS (Battery Energy Storage System) a následně pošle příkaz do střídače. Tohle není sci-fi, to je standardní implementace pomocí frameworků jako LangChain nebo CrewAI, které běží na lokálním železe přes Ollama. Právě schopnost autonomně vykonávat kroky a kontrolovat výsledek je to, co odlišuje hračku od nástroje pro údržbu byznysu.

Pokud vás zajímá, jak se dají tyto technologie využít v moderní energetice, podívejte se na SmartEnergyShare.com. Právě tam se agentní logika potkává s tvrdou realitou energetické sítě, kde o zisku nebo ztrátě rozhodují vteřiny při obchodování s odchylkami.

Lokální AI a údržba soukromí: Zapomeňte na cloud

Posílat citlivá firemní data, jako jsou logy ze serverů, osobní údaje klientů nebo vnitřní technické specifikace, do cloudu OpenAI, je bezpečnostní sebevražda. Viděli jsme to už mockrát – zaměstnanec Samsungu vložil do ChatGPT zdrojový kód a najednou ho věděl celý svět. Pro enterprise nasazení je jedinou cestou Self-Hosted AI.

Díky projektům jako HuggingFace a technikám jako je LoRA (Low-Rank Adaptation) si dnes může i středně velká česká firma "dotrénovat" vlastní model na svých datech za pár tisíc korun. Stačí vám k tomu jedna nebo dvě karty RTX 4090 a trocha trpělivosti. Místo placení paušálu za uživatele platíte jen za elektřinu. A co je nejdůležitější: data nikdy neopustí vaši síť. Lokální modely jako Llama 3 nebo zmíněné Mellum2 dnes v úzce zaměřených úlohách (jako je právě technická údržba nebo analýza logů) s přehledem porážejí své cloudové sourozence. Navíc, odezva (latency) je v milisekundách, což je pro automatizaci kritické. O tom, jak nastavit vlastní infrastrukturu pro sdílení dat, se dočtete více na ShareElectric.cz.

Jak agenti zachraňují energetiku (a vaši peněženku)

Energetika je obor, kde je údržba a predikce alfou i omegou. Představte si, že spravujete bateriové úložiště (BESS) o výkonu 250 kW. Tradiční software funguje na bázi pevných pravidel: "Když je 14:00, nabíjej." Jenže trh je dynamický. AI agent vybavený logikou pro day trading sleduje předpověď osvitu, aktuální cenu na spotovém trhu a stav sítě.

Pokud vidí, že v Německu fouká víc, než se čekalo, a cena letí do záporu, okamžitě zareaguje. To není věc, kterou by dělal člověk u monitoru 24/7. To dělá agent. SmartEnergyShare nabízí přesně tyto služby – od sdílení energie po obchodování s flexibilitou a regulační elektřinou. Propojení těchto služeb s AI agenty, kteří se starají o údržbu optimálního provozu, je důvodem, proč enterprise AI konečně začíná dávat finanční smysl. Nejde o to, že AI "přemýšlí", ale o to, že "hlídá" a "koná". Více o technických aspektech smart grid najdete na SmartEnergyShare.info.

Náklady na provoz: Kolik vás to doopravdy bude stát?

Pojďme k číslům, protože ta zajímají každého majitele firmy. Provozovat "hloupý" chatbot nad GPT-4 pro 50 zaměstnanců vás může vyjít na 20 000 – 50 000 Kč měsíčně jen na poplatcích za API, pokud ho budou aktivně používat. K tomu připočtěte riziko halucinací, které mohou způsobit škody za miliony.

Vlastní server s procesorem AMD Threadripper a dvěma GPU (např. 2x RTX 3090 z bazaru za 40 000 Kč) vás vyjde na jednorázovou investici kolem 100 000 Kč. Spotřeba v zátěži bude cca 600-800 W. S modelem jako Mellum2 nebo Llama-3-8B dokážete obsloužit stovky dotazů za minutu s nulovými marginálními náklady. Návratnost takového systému při automatizaci údržby IT infrastruktury nebo energetického managementu je v řádu měsíců. Pokud k tomu přidáte flexibilitu a začnete prodávat přebytky elektřiny nebo poskytovat podpůrné služby síti (SVR), váš AI server si na sebe vydělá jen tím, že bude chytře řídit vaši baterii.

Závěr: Budoucnost patří orchestraci, ne monolitům

Éra fascinace obřími modely končí. Nastupuje éra specializovaných agentů, kteří spolu komunikují. Jeden agent hlídá ceny elektřiny, druhý stav hardwaru v serverovně, třetí vyřizuje objednávky. Nad nimi stojí "orchestrátor", který jim přiděluje úkoly. Je to návrat k Unixové filozofii: "Dělej jednu věc a dělej ji dobře."

Podnikové AI nasazení v roce 2026 už nebude o tom, kdo má lepší prompt, ale o tom, kdo má lépe navrženou agentní logiku a kdo dokáže efektivně spravovat své lokální zdroje. Failure New Glenn nám připomněl, že bez precizního řízení je i ta nejsilnější raketa jen ohňostroj. Neriskujte, že vaše firma dopadne stejně. Investujte do logiky, ne do humbuku. A pokud chcete začít šetřit na energiích už dnes, SmartEnergyShare je vaše startovací rampa.

Zdroje

- JetBrains Mellum2: A 12B Mixture-of-Experts Model - OTE ČR - Denní trh s elektřinou - HuggingFace - Open Source AI modely - oEnergetice.cz - Aktuality z české energetiky - ČEPS - Podpůrné služby a regulační energie

Obchodujete s batteriovými úložišti nebo hledáte partnera pro flexibilitu a day trading elektřiny? SmartEnergyShare nabízí kompletní řešení pro BESS projekty od 50 do 250 kW - obchodování odchylek, regulační elektřiny a intraday trading. Zjistěte víc na SmartEnergyShare.

Další články na toto téma najdete na: SmartEnergyShare.info - smart grid a AI v energetice SdileniEnergie.info - komunitní energetika