Hay algo en lo que ganamos a la IA por goleada y ninguna inteligencia artificial consigue acertar con precisión. Somos los reyes de la VLM

  • Ningún modelo de IA ha conseguido alcanzar una precisión al 100%

  • GPT-4o, Gemini y Sonnet palidecen al completar pruebas que resultan sencillas para los humanos

Inteligencia Artificial
4 comentarios Facebook Twitter Flipboard E-mail

Pese a que día tras día vemos cómo la IA avanza para mejorar en tareas en las que antes palidecía de forma bastante cómica, hay un aspecto en el que sigue fallando de forma estrepitosa. Según un reciente estudio, los modelos de lenguaje visual de la inteligencia artificial son incapaces de ganarnos en algo tan básico y trivial como la agudeza visual.

Bajo un cómico título que reza, Los modelos de lenguaje visual están ciegos, el paper con investigadores de la Universidad de Auburn y la de Alberta demuestra que GPT-4o, Gemini y Sonnet palidecen al completar pruebas que resultan muy sencillas para la gran mayoría de humanos. Ningún modelo de IA ha conseguido alcanzar una precisión al 100% en las pruebas propuestas.

No imaginéis desafíos extremadamente complejos. Hablamos de pruebas que van desde contar cuántas intersecciones hay en dos líneas de colores hasta definir qué letra está redondeada en distintas palabras. Retos que hasta un niño pequeño podría superar pero que parecen hacerse muy cuesta arriba a la inteligencia artificial.

Ganamos a la IA por goleada en agudeza visual

El caso más significativo parece ser el que, pidiendo a los distintos modelos de IA que contaran las filas y columnas que había en una tabla, incluso la inteligencia artificial que más cerca estuvo de la agudeza visual humana tuvo problemas para quedar por encima del 60% de aciertos. Los investigadores creen que, al no tener fuentes en las que apoyarse por pura memorización, tareas como estas resultan más difíciles pese a ser aparentemente más fáciles, y que sólo mediante un entrenamiento visual más pormenorizado serán capaces de superar el bache.

Imagen | Danieldelosclaveles en Midjourney

En 3DJuegos | El proyecto Star Wars de Corea del Sur dispara rayos láser antiaéreos y es capaz de derribar enemigos en apenas 10 segundos

En 3DJuegos | El peor enemigo del teletrabajo se llama jiggler, un gadget de 10 euros que nació con los videojuegos y ahora provoca despidos multitudinarios

VÍDEO ESPECIAL

402 visualizaciones

Los 100 DETALLES OCULTOS de Dragon Ball Z Budokai Tenkaichi 3

Con el lanzamiento de Dragon Ball: Sparking! ZERO a la vuelta de la esquina, le he estado dando unas cuantas vueltas al mitiquísimo, y ya conocido por todos, Dragon Ball Z Budokai Tenkaichi 3. Eso mismo ha hecho que no solo haya querido traeros un nuevo video de 100 detalles.

  翻译: