Lepší, výkonnější a levnější, ale co ten název?
Levnější???? To si děláte prdel! Naopak, mnohem dražší, než 4o. Jelikož se jedná pouze o API verzi, je udržování kontextu v rámci chatu na vás. A pokud chcete, aby byl kontext zachovaný, musíte při odesílání na API vzít celou předchozí historii zpráv, kterou si ovšem musíte předtím někam ukládat včetně session_id, a poslat ji taky. Tedy ne pouze poslední zprávu. Tím se vám brutálně navýší spotřeba tokenů.
Shrnutí tvrdé pravdy o GPT-4.1 API:
1. API si nedrží kontext, musíš si ho držet a manipulovat s ním sám.
2. API nemá žádnou paměť mezi chaty, všechno musíš simulovat ty odesíláním nafukující se historie.
3. Cena velmi rychle roste se zvětšováním historie, a proto držení velkého kontextu je extrémně drahé!
4. Omezení tokenů (i u 4.1/4o) existuje pořád, takže maximální kontext je omezený počtem tokenů.