Google lanza Gemini, su modelo de inteligencia artificial que aspira a competir con ChatGPT
- "Tiene sofisticadas capacidades de razonamiento y puede codificar a un nivel avanzado", aseguran desde Alphabet
- Una primera versión se incorpora ya a su asistente Bard, pero tienen previsto lanzar otra más avanzada en 2024
Alphabet, la compañía matriz de Google, ha presentado este miércoles su modelo de inteligencia artificial (IA) más avanzado. Se llama Gemini y es capaz de razonar de forma más sofisticada y comprender información con más matices que su anterior herramienta.
La nueva tecnología, que descifra información en vídeo, audio y texto, supone "uno de los mayores esfuerzos de ciencia e ingeniería" llevados a cabo por la empresa, según ha expresado el primer ejecutivo de Alphabet, Sundar Pichai, en una publicación online.
Gemini es "multimedia desde el momento de su creación, tiene sofisticadas capacidades de razonamiento y puede codificar a un nivel avanzado", ha detallado también Eli Collins, vicepresidente de Google DeepMind, el laboratorio de investigación en IA del grupo californiano, durante la presentación a la prensa.
Incorporado a su asistente Bard
Desde el lanzamiento de ChatGPT de OpenAI hace aproximadamente un año, Google ha estado compitiendo para producir software de IA que rivalice con lo que ha presentado la empresa respaldada por Microsoft.
La llamada IA generativa permite obtener textos, imágenes o líneas de código a un nivel equivalente a los producidos por humanos, a partir de una simple consulta en lenguaje cotidiano. Ahora Google ha incorporado una parte de la tecnología del nuevo modelo Gemini a su asistente de IA Bard y tiene previsto lanzar la versión más avanzada en el chatbot a principios del año que viene.
El equipo de ingeniería de Alphabet ha desarrollado tres versiones y cada una está diseñada para utilizar una potencia diferente de procesamiento. La versión más potente está programada para funcionar en centros de datos, y la más pequeña se ejecutará de manera eficiente en dispositivos móviles, han precisado.
¿Qué puede hacer Gemini?
El vídeo de presentación del nuevo modelo de IA de Google muestra una tecnología capaz de identificar objetos, reproducir música y responder a preguntas con cierto grado de análisis y justificando su "razonamiento". "Este es nuestro modelo de IA más consistente, más dotado y también más general", ha asegurado Eli Collins.
Así, las capacidades de Bard han aumentado desde este miércoles, aunque siguen limitándose a consultas escritas, y solo en inglés. Otras funciones y formatos, como la ayuda avanzada para resolver problemas matemáticos, tendrán que esperar hasta 2024. Mientras tanto, Google también dará acceso a una primera versión de Gemini a sus clientes de la nube a partir del 13 de diciembre.
Menos conocido que ChatGPT, Bard tiene la oportunidad de intentar recuperar terreno a su rival, víctima de su propio éxito: a mediados de noviembre, abrumado por la demanda, OpenAI puso en suspenso las suscripciones a la versión de pago. En este ámbito, el gigante de Internet compite directamente con Microsoft, principal inversor de OpenAI y número 2 mundial de la nube, por detrás de Amazon.
Como ventaja, Gemini es "significativamente" más barato que los modelos anteriores desarrollados por la empresa, según Collins: "No solo es más capaz, también es mucho más eficiente".
El vicepresidente de Google DeepMind ha explicado que el último modelo sigue necesitando una cantidad considerable de potencia de cálculo para entrenarse, pero la empresa está mejorando su proceso.
Finalmente, Alphabet ha anunciado también una nueva generación de sus chips de IA personalizados, o unidades de procesamiento tensorial (TPU). La Cloud TPU v5p está diseñada para entrenar grandes modelos de IA y se agrupa en grupos de 8.960 chips. La nueva versión de sus procesadores puede entrenar grandes modelos lingüísticos casi tres veces más rápido que las generaciones anteriores.