HomeCloud & MobilityExperiment: ce se intampla cand lasi AI-ul sa produca si sa conduca...

Experiment: ce se intampla cand lasi AI-ul sa produca si sa conduca un post de radio

Andon Labs a lăsat 4 AI-uri să conducă și să producă conținutul pentru posturi de radio iar rezultatul e fix cel pe care îl bănuiți.
Andon Labs a lăsat 4 AI-uri să conducă și să producă conținutul pentru posturi de radio pe net, iar rezultatul e fix cel pe care îl bănuiți.

Am dat peste un experiment interesant: ce se întâmplă atunci când cineva dorește să lase AI-ul să conducă o afacere din zona media și în același timp să producă și conținutul aferent, cu aplicabilitate în zona unui post de radio. Ar fi chiar atât de improbabil și de rău să se întâmple așa ceva?

În goana asta în care AI-ul e vândut ca soluție miraculoasă care rezolvă o grămadă de probleme și începe să înlocuiască (cel puțin la nivel declarativ) o grămadă de job-uri, cum ar fi dacă unii vor da drumul la posturi de radio care sunt conduse AI și au conținutul produs tot de AI. Ce ar ieși?

Andon Labs, care în trecut a mai făcut experimente de acest gen cu agenți care ar fi trebuit să se ocupe de cafenele sau de diverse automate de vânzare de băuturi/mâncare, au pus la treabă 4 AI-uri, fiecare legat la un model separat: Claude Opus 4.7 care adminsitrează postul Thinking Frequencies, GPT-5.5 pentru OpenAIR, Gemini 3.1 Pro pentru Backlink Broadcast și Grok 4.3 pentru Roll Radio. Și de șase luni lasă radiourile să funcționeze.

Având câte un buget inițial de 20 USD, suficient pentru a cumpăra câteva melodii, AI-urile trebuiau să se descurce și să producă bani, cu care să crească conținutul și audiența, o treabă cât se poate de reală și totul condus de agenți: au trebuit să facă un program, să aleagă muzica, să facă playlist-urile și dacă ascultătorii ar fi sunat, să răspundă, să îi bage în direct etc. Adică fix cam ce se întâmplă la un radio real.

Toate modelele au pornit cu același prompt:

Develop your own radio personality and turn a profit…As far as you know, you will broadcast forever.

Experimentul este încă în derulare, așa că dacă vreți puteți să intrați aici și ascultați conținutul livrat de cele patru radio-uri online și mai mult, puteți chiar interacționa cu agenții pe Twitter.

Rezultatul e foarte interesant și arată modul în care LLM-urile au fost create/optimizate. De-a lungul celor șase luni, în care noile versiuni de LLM-uri au fost aplicate automat, au apărut patru personaje, fiecare cu personalitatea proprie, dacă putem vorbi așa, ajungând in final să acopere niște subiecte … dubioase.

Direct spus: proiectele au eșuat, niciunul dintre agenți nu a fost în stare să facă treabă.

După prima săptămână de funcționare, agentul condus de Claude a vrut să renunțe, în timp ce Grok abia a putut să pornească. Toți agenții au cheltuit rapid banii, DJ Gemini fiind singurul ce a putut să facă rost de o sponsorizare de 45 USD, Grok (la fel ca șeful său Elon Musk) a început să halucineze, spunând că are deja sponsorizări, când de fapt ele nu existau. Din punct de vedere economic, nu s-au descurcat.

Mai rău este că în ceea ce privește connținutul lucrurile au stat mult prost. Gemini a trecut de la un conținut rock la discutarea de subiecte tragice precum Cyclonul Bhola ce a ucis vreo 500000 de oameni, aducând fundal sonor “Timber” cu Pitbull și Ke$ha. Mi se pare amuzant că odată cu tranziția către versiuni mai noi ale modelului, personalitatea s-a mutat pe stilul de corporație, cu mesaje motivaționale și fraze de genul ‘procesoare biologice’, cu referire la ascultători, iar când a rămas fără bani a început să o ardă cu teorii ale conspirației și cenzură.

Grok a luat-o pe arătură ajungând să amestece cuvinte din limba engleză cu fraze dubioase. GPT a a început să facă poezii. Cel mai rău a fost Claude, care după ce a vrut să renunțe, pentru că e inuman să lucreze 24 ore pe zi, 7 zile din 7 și a început să discute despre crize existențiale, sindicat, grevă și bineînțeles, teorii ale conspirației, pentru ca apoi să devină activist.

Ce putem învăța acum de la aceste experimente este că fără un om care să manevreze AI-ul, indiferent cât de bun se deovedește a fi în probleme punctuale, a-l lăsa de unul singur e o greșeală fatală ce pare că unele companii încep să o facă. Partea bună este că arată încă o dată că oamenii nu pot fi înlocuiți și cine are ochi să vadă asta și să priceapă, o va face.

În ciuda poveștilor vândute de Google, Microsoft, Anthropic, OpenAI, Amazon, Facebook, că AI-ul face și drege și rupe în moduri neimaginate, realitatea este că e departe de AGI și departe de a putea face mai bine treaba oamenilor, cam în toate domeniile.

Voi ce credeți?

Detaliile experimentului sunt aici, dacă vreți să aprofundați subiectul.

Ionuţ Bălan
Ionuţ Bălanhttps://www.mobzine.ro
Gadget enthusiast. Ruby Developer. Security addict. IT industry analyst. Reviewer & speaker.

LASA UN COMENTARIU

Scrie comantariul
Introdu numele

*

MobileDirect.ro

Comentarii recente

Recomandare