Era “neograničenog AI-ja” završava: Tokeni postaju nova valuta digitalnog rada

Foto: Freepik.com

Još do jučer se umjetna inteligencija prodavala kao jedan osjećaj beskonačnog obilja. Učitaj čitav repozitorij, zalijepi ugovor, ubaci transkript sastanka od stotinu stranica, zapitkuj dok odgovor ne bude savršen… Platforme su nas učile da s AI agentima razgovaramo kao da iza njih stoji beskonačan resurs: beskonačno strpljenje, beskonačna memorija i beskonačna računalna snaga.

Danas postaje jasno da toga nikada nije bilo. Iza svake “magične” konverzacije cijelo je vrijeme stajao vrlo stvaran trošak, a taj se trošak sada više ne skriva.

Sve više korisnika u novije vrijeme ima isti osjećaj kako limiti dolaze brže nego prije, tokeni nestaju brže nego prije, a pretplate koje su nekoć djelovale jeftino odjednom se više takvima ne čine. To definitvno nije samo dojam već činjenica. Korisnici danas više ne koriste AI kao običan chatbot, nego sve češće kao radni alat, osobnog asistenta, programera, istraživača i operativca u istom razgovoru.

Svaka datoteka, svaki dodatni alat, svaka iteracija, svaki dugi odgovor i svaki kontekst koji se vuče iz prethodnih poruka povećava potrošnju. Ono što je nekad bio jedan prompt, danas je cijeli radni proces. A radni proces košta – i to ne malo.

AI ulazi u fazu troškovne racionalnosti

Kad je riječ o ulasku AI industrije u fazu u kojoj će korisnici i kompanije morati puno pažljivije upravljati tokenima, kontekstom i stvarnim troškom korištenja modela, Davor Aničić iz CroAI (Hrvatske AI udruge) kaže kako smo svjedoci upravo takve tranzicije. 

“Implementacija AI modela poslovnim procesima tvrtki je uglavnom nepovratan proces tako da je dugoročno razmišljanje o troškovima mora biti već kod samog dizajna sustava. Posebno ako je sustav agentski pri čemu AI agent ima određenu slobodu korištenja tokena ovisno o trenutnoj potrebi. Jedno od rješenja je optimalno kombiniranje lokalno instaliranih AI modela i s modelima koji se koriste u oblaku i plaćaju prema korištenju,” rekao je.

Činjenica je da su alati za kodiranje, AI agenti i dugi konteksti definitivno znatno promijenili ekonomiku korištenja AI-ja u odnosu na prije godinu dana. Aničić potvrđuje kako je ta promjena nastupila vrlo brzo. 

“S jedne strane broj upotrijebljenih tokena značajno raste, ali i cijene korištenja za sada još relativno često padaju. Jedna od metoda je korištenje optimalnog modela ovisno o zadatku. Čemu koristiti najnoviji i najskuplji model ukoliko i stariji i jeftiniji jednako dobro rješava specifični zadatak,” komentirao je.

Umjetna inteligencija, Foto: Tara Winstead/Pexels

Nadodao je i da kada je riječ o korištenjui AI alata za osobnu upotrebu, na većini radnih  mjesta i dalje možemo govoriti o neograničenom korištenju uz fiksnu cijenu. 

Izuzetak je, objasnio je, korištenje za kodiranje i razvoja softvera jer tu su troškovi i mogućnosti da oni dodatno narastu značajni i važno je gledati povrat na investiciju ne samo u smislu direktnog troška nego i dugoročne održivosti.

“Korištenje AI agenata je područje u kojoj je to posebno važno ugraditi dovoljno zaštitnih mehanizama za kontrolu troškova te stalno preispitivati opravdava li poslovni učinak trošak,” zaključio je Aničić. 

Upravo zato potezi kompanija poput Anthropica nisu samo tehnička promjena nego tržišni signal. Kada tvrtka korisnicima poruči da nakon uključene potrošnje mogu nastaviti samo uz dodatno plaćanje, kada ograniči korištenje pretplate kroz vanjske aplikacije i kada počne otvoreno savjetovati korisnike da “čiste” kontekst, skraćuju upute i pažljivije biraju što ostaje u memoriji modela, ona zapravo priznaje ono što je industrija dugo pokušavala ublažiti marketinškom pričom: AI nije beskonačan, nego racionaliziran resurs.

Kraj modela “all you can eat”

Token je zato prestao biti apstraktna tehnička riječ i postao ekonomska činjenica. On više nije samo mjerna jedinica jezika, nego jedinica memorije, vremena i računalnog troška. Drugim riječima, to je način na koji se danas raspoređuju pažnja stroja i kapacitet infrastrukture.

Što korisnici traže više (dulji kontekst, više alata, kompleksnije zadatke, agentne procese, kodiranje preko cijelih baza i višesatne sesije), to sustav postaje skuplji za održavanje. U toj točki pretplata više nije “all you can eat” model, nego subvencionirani ulaz u vrlo skupu infrastrukturu.

To posebno vrijedi za novu generaciju AI alata koji se ponašaju manje kao sugovornici, a više kao digitalni radnici. Kodiranje, analiza koda, upravljanje datotekama, pokretanje naredbi, korištenje konektora, obrada dugih dokumenata i višekoračni zadaci gutaju goleme količine resursa. Kad jedan model mora nositi cijeli repozitorij kroz više iteracija, pregledavati stare odgovore, čuvati planove i ponovno obrađivati iste ulazne podatke, on ne troši samo više tokena nego i više vremena, memorije i infrastrukture. Korisniku to izgleda kao “jedna sesija”. Davatelju usluge to izgleda kao ozbiljan račun.

Zato više nije dovoljno reći da modeli postaju pametniji i jeftiniji. Da, sirovi trošak inferencije pada, ali tržište ne oblikuje samo pad troška po jedinici, nego i eksplozija zahtjeva po korisniku. Ljudi danas od modela traže više nego prije godinu dana. Ne žele samo odgovor; žele proces. Ne žele samo tekst; žele alat koji će misliti s njima, raditi umjesto njih, pamtiti sve i ostati dostupan cijeli dan. Upravo tu nastaje raskorak između očekivanja korisnika i poslovne realnosti pružatelja AI-ja.

U tom smislu AI industrija ulazi u fazu sazrijevanja. Ono što se donedavno prodavalo kao gotovo neograničena inteligencija za fiksnu mjesečnu cijenu sada se sve otvorenije razdvaja na tri modela: ono što stane u pretplatu, ono što ide na dodatnu naplatu i ono što korisnik mora preseliti na vlastiti hardver ili otvorene modele.

To nije nužno loša vijest. Naprotiv, to znači da tržište napokon počinje nalikovati stvarnoj ekonomiji, a ne demonstraciji tehnološkog obilja.

Tržište traži racionalnije korisnike

U tom novom svijetu kontekst više neće biti nešto što se gomila bez razmišljanja. Bit će to resurs kojim se upravlja. Korisnici će morati naučiti raditi ono što su inženjeri oduvijek radili kad resurs nije beskonačan: rezati višak, birati bitno, organizirati ulaze i paziti što model stvarno treba znati da bi napravio posao. Drugim riječima, AI više neće nagrađivati samo kreativnost i brzinu, nego i disciplinu.

Naravno, dio korisnika pokušat će pobjeći od toga. Već se okreću lokalnim modelima koje pokreću sami, kako bi izbjegli stalno plaćanje za ponovno čitanje istih datoteka i istih zadataka. Ali ni to nije čarobno rješenje. Tamo gdje nestane vendorov token meter, pojavljuju se druga ograničenja: memorija, VRAM, brzina, širina konteksta i kvaliteta modela. Problem se ne briše, samo se seli.

Zato je možda najvažnije razumjeti da priča o tokenima nije sitna tehnička iritacija, nego znak da se AI tržište mijenja. Besplatni ili paušalni osjećaj beskonačnosti polako ustupa mjesto stvarnoj ekonomiji računalne snage. To je trenutak u kojem umjetna inteligencija prestaje biti digitalna fantazija neograničenog i počinje biti ono što je cijelo vrijeme bila – iznimno moćan, ali i iznimno skup alat.

A kad se tržište jednom počne ponašati kao tržište, tada i korisnici moraju početi razmišljati kao kupci, a ne kao publika koja vjeruje da čarolija traje zauvijek.

Odgovori

Vaša adresa e-pošte neće biti objavljena. Obavezna polja su označena sa * (obavezno)

Popularno

Novi broj magazina „Financije.hr” donosi brojne ekskluzivne poslovne priče, intervjue i događaje iz regije i svijeta…

Komentari