Un studiu estimează că 35% dintre site-urile noi sunt deja generate sau asistate de AI

Un studiu publicat în aprilie de cercetători de la Imperial College London, Stanford și Internet Archive estimează că, până la jumătatea lui 2025, aproximativ 35% dintre site-urile nou publicate au fost generate sau asistate de inteligență artificială. Autorii au analizat mostre de pagini din arhiva Wayback Machine pe o perioadă de 33 de luni, din august 2022 până în mai 2025.

Rezultatul nu înseamnă că o treime din internet este scrisă integral de modele AI. Formula folosită în studiu este „AI-generated or AI-assisted”, adică include atât pagini produse în mare parte automat, cât și pagini în care AI a fost folosit doar pentru părți din text. Chiar și așa, proporția este suficient de mare încât să arate o schimbare clară în felul în care este produs conținutul nou de pe web.

Cercetarea nu s-a oprit la volum. Autorii au încercat să vadă dacă această schimbare modifică și felul în care arată internetul. Una dintre concluziile lor este că paginile clasificate ca fiind generate sau asistate de AI tind să fie mai asemănătoare între ele din punct de vedere semantic decât cele scrise de oameni. O altă concluzie este că tonul lor este mai pozitiv. Heise, care a relatat studiul, rezumă aceste rezultate prin două efecte principale: mai puțină diversitate de conținut și o creștere clară a formulărilor optimiste sau neutru-lustruite.

Asta este poate partea cea mai interesantă a studiului. Discuția publică despre conținutul generat de AI este dominată de obicei de frica de erori factuale și dezinformare. Cercetătorii spun însă că, în setul lor de date, cele mai vizibile efecte nu au fost acestea, ci uniformizarea. Cu alte cuvinte, web-ul nou pare să devină mai previzibil în structură, vocabular și ton, chiar și atunci când nu este neapărat mai fals.

Pentru utilizatorul obișnuit, schimbarea nu se vede neapărat într-un singur site, ci în experiența generală de căutare și lectură. Mai multe pagini ajung să semene între ele, să răspundă într-un stil apropiat și să refolosească aceleași formule. Asta poate face informația mai ușor de parcurs, dar și mai puțin distinctă. În practică, internetul nu devine doar mai automatizat, ci și mai omogen.

Studiul ridică și o întrebare care contează pentru următoarea etapă a AI. Dacă tot mai mult din conținutul nou publicat este produs de modele, atunci modelele viitoare vor fi antrenate într-o măsură tot mai mare pe text generat de alte modele. Autorii nu spun că acest proces produce deja un colaps al calității, dar îl tratează ca pe un risc real pentru diversitatea datelor de antrenare și pentru calitatea viitoarelor sisteme.

Mai este și o limită importantă. Studiul se bazează pe clasificarea automată a textului cu un detector, nu pe o etichetare perfectă, făcută manual, a fiecărei pagini. Asta înseamnă că procentul de 35% trebuie citit ca o estimare de cercetare, nu ca un recensământ exact al întregului web. Dar chiar și cu această rezervă, semnalul rămâne puternic: AI nu mai este o prezență marginală în conținutul nou publicat online. A devenit o componentă normală a lui.

Distribuie:

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *