Google, acuzată: IA livrează „milioane de răspunsuri false” pe oră

Inteligența Artificială Google, sub focul criticilor: milioane de răspunsuri eronate oră

Un studiu recent arată că funcția AI Overviews, integrată în motorul de căutare Google, generează răspunsuri corecte în doar 90% din cazuri. Aceasta înseamnă că, la fiecare 10 căutări, cel puțin unul dintre răspunsuri este eronat. Cu numărul uriaș de căutări efectuate zilnic, vorbim despre milioane de informații false furnizate utilizatorilor în fiecare oră.

Testul SimpleQA și rezultatele surprinzătoare

Experimentul, realizat în colaborare cu un startup specializat în inteligență artificială, a folosit SimpleQA, un test standardizat creat de OpenAI. Acesta conține 4.000 de întrebări menite să evalueze acuratețea modelelor de inteligență artificială. Primele teste au fost efectuate anul trecut, când funcția AI Overviews folosea modelul Gemini 2.5. La acel moment, precizia era de 85%.

Actualizarea la Gemini 3 a îmbunătățit ușor rezultatele, ridicând precizia la 91%. Cu toate acestea, extrapolând aceste cifre la volumul total de căutări, se estimează că milioane de răspunsuri eronate sunt generate în fiecare oră. Această situație ridică semne de întrebare cu privire la impactul pe care îl are inteligența artificială asupra informațiilor pe care le accesează utilizatorii.

Reacțiile Google și provocările evaluării AI

Google a contestat metodologia studiului. Un purtător de cuvânt a declarat că testul SimpleQA poate conține inexactități. Compania americană folosește propriul test, SimpleQA Verified, construit pe un eșantion mai mic, dar verificat mai atent. Google susține că rezultatele studiului nu reflectă cu exactitate ceea ce caută oamenii pe platforma sa.

Evaluarea preciziei inteligenței artificiale rămâne o provocare complexă. Fiecare companie are propriile metode de a demonstra performanțele modelelor sale, iar rezultatele pot varia. De asemenea, modelele pot oferi răspunsuri diferite la aceeași întrebare, complicând procesul de evaluare.

O altă particularitate este că AI Overviews nu este singurul model folosit. Google a menționat că sistemul selectează „cel mai relevant” răspuns pentru fiecare interogare. Deși modelele Gemini 3.1 Pro ar putea oferi răspunsuri mai precise, acestea sunt mai lente și costisitoare, fiind preferate modelele Gemini Flash.

În ciuda controverselor, Google menționează la finalul fiecărui răspuns generat de AI: „AI poate greși, așa că verificați încă o dată”.

Raluca Florea

Autor

Lasa un comentariu