| Tech

Gemini 3 podría significar la delantera de Google en la carrera armamentística de la IA

En una serie de pruebas de referencia clave, el nuevo modelo recibió las mejores puntuaciones.

Gemini 3 podría significar la delantera de Google en la carrera armamentística de la IA [Imagen: Google]

Google anunció el martes su muy esperado modelo Gemini 3. Según muchas métricas clave, parece ser más capaz que los otros grandes modelos de inteligencia artificial (IA) generativa del mercado.

En una muestra de confianza en el rendimiento –y la seguridad– del nuevo modelo, Google está poniendo una variante de Gemini –Gemini 3 Pro– a disposición de todos a través de la aplicación a partir de ahora. También está incorporando el mismo modelo a su servicio de búsqueda principal para suscriptores.

El nuevo modelo superó las puntuaciones de la muy citada prueba LMArena, una preferencia colectiva de varios modelos de alto nivel basada en respuestas directas a preguntas idénticas. En la prueba de referencia súper difícil Humanity’s Last Exam, que midió el razonamiento y el conocimiento, Gemini 3 Pro obtuvo 37.4% en comparación con 31.6% de GPT-5 Pro. Gemini 3 también superó una serie de otras pruebas de referencia que miden todo, desde el razonamiento hasta el conocimiento académico, las matemáticas, el uso de herramientas y las funciones del agente.

Gemini ha sido un modelo multimodal desde el principio, lo que significa que puede comprender y razonar no solo sobre el lenguaje, sino también sobre imágenes, audio, video y código, todo al mismo tiempo. Esta capacidad ha mejorado constantemente desde el primer Gemini, y Gemini 3 alcanzó un rendimiento de vanguardia en la prueba comparativa MMMU-Pro, que mide la capacidad de un modelo para manejar el razonamiento a nivel universitario y profesional en texto e imágenes. También superó la prueba comparativa Video-MMMU, que mide la capacidad de razonar sobre los detalles de las grabaciones de video. Por ejemplo, el modelo Gemini podría procesar varios videos de YouTube y luego crear un conjunto de tarjetas de memoria basadas en lo que aprendió

Más allá de los benchmarks

Gemini también destacó por su capacidad para crear código informático. Por eso, era el momento idóneo para que la empresa lanzara Antigravity, un nuevo agente de codificación similar a Cursor. El desarrollo de software ha demostrado ser una de las primeras funciones empresariales en las que la IA generativa ha tenido un impacto positivo cuantificable. 

Los benchmarks son reveladores, pero como demostró la respuesta a GPT-5.1 de OpenAI, la “sensación” o “personalidad” de un modelo importa a los usuarios –muchos consideraron que GPT-5 representaba una drástica degradación en cuanto a personalidad respecto a GPT-4–. El CEO de Google DeepMind, Demis Hassabis, pareció reconocerlo en un tuit el martes: “Más allá de los benchmarks, ha sido, con diferencia, mi modelo favorito por su estilo y profundidad, y por su utilidad en las tareas cotidianas”. Por supuesto, los usuarios tendrán su propia opinión sobre el estilo de comunicación de Gemini 3 y su grado de adaptación a sus preferencias y hábitos de trabajo.

Con el lanzamiento del modelo de IA generativa de tercera generación de Google, es un buen momento para analizar el contexto más amplio de la carrera por construir los modelos de IA dominantes del siglo XXI. Recordemos que la competencia solo tiene unos pocos años. Hasta ahora, los modelos de OpenAI han pasado la mayor parte del tiempo en la cima de las clasificaciones de referencia y, gracias a ChatGPT, han acaparado la mayor parte de la atención de todos los participantes en la emergente industria de la IA. 

¿La historia está de su lado?

Desde el principio, Google ha disfrutado de algunas ventajas distintivas. Ha estado invirtiendo en talento e investigación en IA durante décadas, mucho antes de que OpenAI se convirtiera en una empresa en 2015. Comenzó a desarrollar técnicas de aprendizaje automático para comprender la intención de búsqueda, definir el PageRank y colocar anuncios ya en 2001. Compró el laboratorio de investigación de IA DeepMind, con sede en Londres, en 2014, y DeepMind ha sido responsable de algunos de los mayores logros de Google en IA –AlphaGoAlphaFold, modelos Gemini–.  

Los grandes avances en investigación que permitieron la actual ola de modelos de IA generativos tuvieron lugar en Google. En 2017, los investigadores de Google inventaron la arquitectura del modelo de lenguaje Transformer, que permitió a los modelos de lenguaje de aprendizaje (LLM) aprender mucho más de sus datos de entrenamiento que los modelos de lenguaje anteriores. Al año siguiente, Google utilizó la arquitectura Transformer para construir su modelo de lenguaje BERT, que condujo directamente a los modelos GPT que impulsan ChatGPT. De hecho, el gigante de las búsquedas desarrolló un chatbot de IA mucho antes que OpenAI, pero tenía dudas sobre lanzarlo o integrarlo en sus otros productos debido a preocupaciones legales y de modelo de negocio

Todos los datos

Google tiene acceso a más datos de entrenamiento y de mejor calidad que cualquier otra empresa de IA. Ha estado indexando la mayor parte de la información en la web desde 1998. También posee enormes cantidades de información, como datos de negocios locales, datos de mapas y reseñas de clientes, que se pueden utilizar para entrenar modelos de IA o aumentar su salida –dentro de los resultados de búsqueda, por ejemplo–. 

Los modelos generativos están adquiriendo ahora la capacidad de aprender sobre el mundo a partir de videos, del mismo modo que aprenden de grandes cantidades de texto. Con YouTube, Google tiene acceso a una enorme cantidad de contenido, y sus modelos de IA podrían obtener una ventaja de inteligencia cada vez mayor al entrenarse con él.

A medida que la IA comienza a gestionar cada vez más nuestras tareas personales y laborales, las ventajas de Google en experiencia, talento, datos y otros recursos pueden ayudar a mantener el estatus de vanguardia y la funcionalidad general de Gemini en los próximos años. 

Alto riesgo

Esto es más que qué empresa puede vender la mayor cantidad de acceso a la API de sus modelos o suscripciones a un chatbot. Dado que modelos como Gemini, Claude y GPT-5 pueden llegar a ser más inteligentes –quizás mucho más inteligentes– que los humanos en casi cualquier tarea, la empresa con los modelos que alcancen ese nivel, también llamado “inteligencia artificial general” (IAG), puede dominar el mercado de la IA para consumidores y empresas de la misma manera que Google dominó las búsquedas en las primeras décadas de este siglo.

Con las empresas tecnológicas gastando ya cientos de miles de millones en construir la infraestructura para sus negocios de IA, la presión aumenta para impulsar con más fuerza y ​​rapidez el desarrollo de nuevas generaciones de modelos.

Author

  • Mark Sullivan

    Mark Sullivan es redactor sénior de Fast Company y cubre temas de tecnología emergente, inteligencia artificial y políticas tecnológicas. Antes de incorporarse a Fast Company en enero de 2016, Sullivan escribió para VentureBeat, Light Reading, CNET, Wired y PCWorld. Síguelo en Twitter @thesullivan

    View all posts

Author

  • Mark Sullivan

    Mark Sullivan es redactor sénior de Fast Company y cubre temas de tecnología emergente, inteligencia artificial y políticas tecnológicas. Antes de incorporarse a Fast Company en enero de 2016, Sullivan escribió para VentureBeat, Light Reading, CNET, Wired y PCWorld. Síguelo en Twitter @thesullivan

    View all posts

Sobre el autor

Mark Sullivan es redactor sénior de Fast Company y cubre temas de tecnología emergente, inteligencia artificial y políticas tecnológicas. Antes de incorporarse a Fast Company en enero de 2016, Sullivan escribió para VentureBeat, Light Reading, CNET, Wired y PCWorld. Síguelo en Twitter @thesullivan