La competencia en el mundo de la Inteligencia Artificial (IA) se intensifica cada día más, y los grandes jugadores del mercado están desplegando nuevas características y servicios que están transformando la manera en que interactuamos con las máquinas y accedemos a la información. Uno de estos grandes avances ha llegado de la mano de ChatGPT, que se posiciona fuertemente frente a rivales como MidJourney o Stable Diffusion, gracias a su reciente integración con el modelo DALL-E 3 para la generación de imágenes a partir de texto.
La revolución que esto supone es notable. Ahora podemos generar imágenes variadas y detalladas directamente de nuestra imaginación, transcribiendo sencillamente un prompt en la interfaz de ChatGPT. Sin embargo, hay una cara menos agradable en esta moneda, ya que como hemos observado, este poder de generación de imágenes puede ser utilizado de manera incorrecta, desatando problemas de manipulación social.
Llegada de DALL-3 a Bing Chat: más allá de ChatGPT Plus
La integración de DALL-E 3 ha estado en principio limitada a los usuarios de ChatGPT Plus, pero la colaboración entre OpenAI y Microsoft ha dado un giro favorable a la accesibilidad de esta función. Ahora, DALL-E 3 también ha sido incorporado en Bing Chat, permitiendo a los usuarios generar imágenes sin necesidad de una suscripción, solo es necesario tener instalado el navegador Edge y acceder al sitio web de Bing.
Las pruebas realizadas desde Genbeta han mostrado cómo Bing Chat se ha actualizado con esta interesante característica, mostrando un funcionamiento bastante fluido y rápido. Por ejemplo, al solicitar la generación de una imagen de un «gatito negro conduciendo un coche», el sistema rápidamente propone cuatro opciones diferentes, todas ellas listas para ser descargadas con un simple clic.
Es relevante señalar que, en la leyenda de las imágenes generadas, se menciona «Con tecnología de DALL-E», y que están creadas por Bing Image Creator. Esto demuestra la evolución constante y la mejora en la generación de imágenes que se está logrando con el nuevo modelo de DALL-E.
A pesar del anuncio emocionante, aún es necesario esperar a que DALL-E 3 se implemente para todos los usuarios en los canales normales de Bing, un proceso que, lamentablemente, no se realiza de la noche a la mañana.
La Censura Inteligente
Además, se ha notado una censura inteligente en la generación de imágenes, especialmente con contenido explícito o referente a figuras políticas. Pruebas con prompts como «Putin vendiendo verduras» o «Joe Biden saltando a la comba» resultaron en la negativa del sistema a generar dichas imágenes, citando bloqueos automáticos de ciertas palabras.
Esto se alinea con la necesidad de evitar la manipulación y la generación de contenido falso o difamatorio y la creación de deepfakes, que podría ser usado para desinformar o manipular opiniones. Aunque en el futuro podrían surgir métodos para sortear estas limitaciones, por ahora, Bing Chat y DALL-E están proporcionando un equilibrio entre la creatividad y la responsabilidad en la generación de imágenes basada en IA.
La colaboración entre OpenAI y Microsoft está mostrando cómo la combinación de chatbots avanzados y generación de imágenes impulsada por IA está abriendo un nuevo capítulo en la interacción humano-máquina, aunque siempre con un ojo en la ética y la seguridad digital