11. 3. 2026 - Nasadenie modelu GPT-5.4
OpenAI na svojej strane k 4. 2. 2026 zvýšilo thinking effort pre nastavenie Medium pri predchádzajúcom používanom modeli GPT-5.2 natoľko, že priemerná útrata vzrástla takmer o 30 % na správu.
Ide o to, že vstupné tokeny sú za určitú cenu, zatiaľ čo výstupné tokeny, medzi ktoré sa počítajú aj thinking tokeny, sú zhruba 12x drahšie. Aj relatívne malé zvýšenie úsilia pri uvažovaní preto vedie k viditeľnému navýšeniu ceny.
Dňa 5. 3. 2026 vyšiel model GPT-5.4, ktorý podľa našich interných benchmarkov, ako aj napríklad ARC AGI v2, ukazuje zvýšenie úspešnosti pri znížení ceny. Jeho nízke úsilie vyzerá kvalitnejšie než Medium pri GPT-5.2.
-
- sme teda do produkcie zaviedli nový model s východiskovým nastavením
thinking effortnaLow. Súčasne s tým sa naše úvahy uberali smerom dať pokročilým používateľom viac možností a voľnosti meniť parametre modelu - dostať odpovede premyslenejšie tam, kde je to potrebné, alebo rýchlejšie a lacnejšie, pokiaľ netrvajú na hlbšom prieskume, alebo ak nie je na škodu si dlhšie počkať. Východiskové nastavenie sme teda dalithinking effortnaLows možnosťou konfigurácie. S týmto to bolo v produkcii celý deň. Po nazbieraní dát sme 11. 3. 2026 vrátili východiskové nastaveniethinking effortunaMedium.
- sme teda do produkcie zaviedli nový model s východiskovým nastavením
Prvé produkčné dáta
Pre porovnanie uvádzame štyri po sebe nasledujúce dni:
| Dátum | Model a nastavenie | Pozitívne z celku | Negatívna spätná väzba | Priemerná spotreba |
|---|---|---|---|---|
| 9. 3. 2026 | GPT-5.2, Medium | 76 z 88 (86,4 %) | 12 | 8 316 kreditov |
| 10. 3. 2026 | GPT-5.4, nízke uvažovanie, nízka podrobnosť | 98 z 106 (92,5 %) | 8 | 3 337 kreditov |
| 11. 3. 2026 | GPT-5.4, stredné uvažovanie, nízka podrobnosť | 108 z 113 (95,6 %) | 5 | 4 718 kreditov |
| 12. 3. 2026 | GPT-5.4, stredné uvažovanie, nízka podrobnosť | 107 z 120 (89,2 %) | 13 | 4 422 kreditov |
Graficky je trend vidieť nižšie:
Prvý deň po nasadení GPT-5.4 teda priniesol súčasne viac pozitívnej spätnej väzby a výrazne nižšiu priemernú spotrebu kreditov oproti 9. 3. 2026. Po návrate na Medium dňa 11. 3. 2026 priemerná spotreba znovu vzrástla, ale zostala pod úrovňou pôvodného nastavenia GPT-5.2.
Budeme to priebežne vyhodnocovať a do dokumentácie postupne doplníme odporúčania pre jednotlivé skupiny používateľov a typy dotazov.
