Esta es la nueva capacidad de la IA de Google que es gratuita y no tienen ChatGPT ni Copilot

Gemini ya es más multimodal que sus competidores

La app Gemini ya admite la subida de vídeos para analizarlos.Europa Press

Alfredo Biurrun
Alfredo Biurrun

Creada: 18.06.2025 22:45

Última actualización: 18.06.2025 22:45

Durante 2023 y 2024, Google dio la sensación de ir por detrás en los avances en inteligencia artificial para el mercado de consumo frente a competidores como Microsoft y, sobre todo, OpenAI. Este año, sin embargo, está logrando revertir esa percepción gracias al despliegue de Gemini en sus plataformas y aplicaciones, así como por las novedades que va incorporando, con mención especial a las presentadas en el último Google I/O del pasado mayo.

Este lunes, la compañía ha vuelto a actualizar su oferta de modelos de lenguaje dentro del chatbot, pero también ha incluido una novedad muy relevante que no ha anunciado, pero sí han detectado en 9to5Google.

La multimodalidad de las IA, que les permite aceptar diferentes formatos de datos como entrada y salida, ha dado un nuevo paso adelante con la capacidad de Gemini para procesar vídeos proporcionados por el usuario, analizarlos y responder sobre ellos.

¿Por qué Google no ha anunciado una mejora de este calado? Desde el medio señalan que la función aún no está disponible de forma generalizada y que varía según cuentas y dispositivos. Pueden utilizarla tanto cuentas gratuitas como de pago en Android e iOS, pero aún no está disponible en la versión web. Presumiblemente, por ahora, solo en el mercado estadounidense. Es más como si estuviera en pruebas que de tratarse de un lanzamiento formal, lo que explicaría que Google no haya dicho nada.

En las pruebas realizadas, 9to5Google obtuvo descripciones sobre los vídeos subidos al chatbot, que también los mostraba dentro de un reproductor junto con la respuesta.

Esta es una mejora importante sobre la multimodalidad que actualmente ofrecen tanto ChatGPT como Copilot, que probablemente no tarden demasiado en incorporar esa capacidad. Lógicamente, que un usuario pueda subir cualquier vídeo a la plataforma, que de forma predeterminada los usa para su entrenamiento como el resto del contenido que se introduce, abre un nuevo frente dentro de la cuestión de la propiedad intelectual y las inteligencias artificiales generativas.

Las otras novedades que Gemini recibió este martes fueron un nuevo modelo que se añade a la familia Gemini 2.5 y cambios de estado de otros. Gemini 2.5 Pro y Gemini 2.5 Flash, anunciados en el último Google I/O, pasan de la fase de preview a estable y están disponibles para todos los usuarios.

El nuevo 2.5 Flash-Lite, en fase preview y disponible a través de las plataformas Google AI Studio y Vertex AI, se presenta como el más rápido y rentable de la familia Gemini 2.5 y está diseñado para tareas de alto volumen donde la eficiencia de costes es clave. Es de esperar que no tarde demasiado en llegar a la app de Gemini.