CODEXIS AI
Príručka CODEXIS AINovinky

11. 3. 2026 - Nasadenie modelu GPT-5.4

OpenAI na svojej strane k 4. 2. 2026 zvýšilo thinking effort pre nastavenie Medium pri predchádzajúcom používanom modeli GPT-5.2 natoľko, že priemerná útrata vzrástla takmer o 30 % na správu.

Ide o to, že vstupné tokeny sú za určitú cenu, zatiaľ čo výstupné tokeny, medzi ktoré sa počítajú aj thinking tokeny, sú zhruba 12x drahšie. Aj relatívne malé zvýšenie úsilia pri uvažovaní preto vedie k viditeľnému navýšeniu ceny.

Dňa 5. 3. 2026 vyšiel model GPT-5.4, ktorý podľa našich interných benchmarkov, ako aj napríklad ARC AGI v2, ukazuje zvýšenie úspešnosti pri znížení ceny. Jeho nízke úsilie vyzerá kvalitnejšie než Medium pri GPT-5.2.

    1. sme teda do produkcie zaviedli nový model s východiskovým nastavením thinking effort na Low. Súčasne s tým sa naše úvahy uberali smerom dať pokročilým používateľom viac možností a voľnosti meniť parametre modelu - dostať odpovede premyslenejšie tam, kde je to potrebné, alebo rýchlejšie a lacnejšie, pokiaľ netrvajú na hlbšom prieskume, alebo ak nie je na škodu si dlhšie počkať. Východiskové nastavenie sme teda dali thinking effort na Low s možnosťou konfigurácie. S týmto to bolo v produkcii celý deň. Po nazbieraní dát sme 11. 3. 2026 vrátili východiskové nastavenie thinking effortu na Medium.

Prvé produkčné dáta

Pre porovnanie uvádzame štyri po sebe nasledujúce dni:

DátumModel a nastaveniePozitívne z celkuNegatívna spätná väzbaPriemerná spotreba
9. 3. 2026GPT-5.2, Medium76 z 88 (86,4 %)128 316 kreditov
10. 3. 2026GPT-5.4, nízke uvažovanie, nízka podrobnosť98 z 106 (92,5 %)83 337 kreditov
11. 3. 2026GPT-5.4, stredné uvažovanie, nízka podrobnosť108 z 113 (95,6 %)54 718 kreditov
12. 3. 2026GPT-5.4, stredné uvažovanie, nízka podrobnosť107 z 120 (89,2 %)134 422 kreditov

Graficky je trend vidieť nižšie:

Porovnanie pozitívnej spätnej väzby a priemernej spotreby kreditov

Prvý deň po nasadení GPT-5.4 teda priniesol súčasne viac pozitívnej spätnej väzby a výrazne nižšiu priemernú spotrebu kreditov oproti 9. 3. 2026. Po návrate na Medium dňa 11. 3. 2026 priemerná spotreba znovu vzrástla, ale zostala pod úrovňou pôvodného nastavenia GPT-5.2.

Budeme to priebežne vyhodnocovať a do dokumentácie postupne doplníme odporúčania pre jednotlivé skupiny používateľov a typy dotazov.

ARC AGI v2 benchmark

Obsah stránky