Microsoft dio un paso importante en el desarrollo de inteligencia artificial al lanzar oficialmente su primer modelo para generar imágenes realistas.

La herramienta, llamada MAI-Image-1, ya se encuentra disponible dentro del creador de imágenes de Bing y puede utilizarse sin costo desde la web o dispositivos móviles. A partir de ahora, cualquier usuario con una cuenta de Microsoft puede acceder a esta tecnología y comenzar a crear imágenes en cuestión de segundos.

Mustafa Suleyman, director de Microsoft AI y cofundador de DeepMind, confirmó el lanzamiento a través de su cuenta en la red social X.

Según explicó, MAI-Image-1 se destaca por su capacidad para generar imágenes con detalles fotorrealistas, escenas naturales, iluminación artística y representaciones visuales de alimentos. Para utilizarla, basta con describir la imagen deseada o subir una propia que se quiera transformar o mejorar con ayuda de la inteligencia artificial.Microsoft desarrolló MAI-Image-1 de forma interna, sin recurrir a modelos de terceros.

El entrenamiento del sistema se realizó con datos cuidadosamente seleccionados y se evaluó con tareas que responden a las necesidades creativas actuales.

Durante la presentación, la empresa señaló que contó con la colaboración de profesionales del sector creativo para perfeccionar el modelo a partir de su retroalimentación.

La compañía asegura que su IA puede manejar detalles visuales complejos. El selector de modelos de Bing indica que MAI-Image-1 ofrece resultados con excelente iluminación, texturas y nivel de detalle. Para demostrar sus capacidades, Suleyman compartió cuatro imágenes generadas por el modelo, en las que se aprecian distintos objetos y condiciones visuales.

Aunque MAI-Image-1 no alcanza todavía el nivel de plataformas como Midjourney, representa un avance significativo. En pruebas realizadas por otros usuarios, el modelo mostró un rendimiento sólido, especialmente cuando se introducen descripciones detalladas.

El contexto resulta clave para obtener buenos resultados, por lo que conviene incluir elementos como la iluminación o la técnica fotográfica al redactar el prompt.MAI-Image-1 permite generar imágenes en formatos de aspecto 1:1, 3:2 y 2:3, los mismos que utiliza GPT-4o.

Las imágenes pueden descargarse con una resolución máxima de 1248 por 832 píxeles. Si el usuario desea modificar el prompt o subir una fotografía propia, puede hacerlo desde la sección Editar solicitud.

Esta acción generará una nueva imagen, ya que el modelo no permite editar ni iterar sobre imágenes previamente creadas.

Además de su integración en Bing, Microsoft anunció que MAI-Image-1 también se encuentra disponible dentro de las expresiones de audio de Copilot. Esta función experimental permite generar imágenes a partir del contenido de un archivo de audio.

Por ejemplo, al utilizar el modo Historia, la IA analiza el contenido del audio y crea una imagen que representa visualmente el tema o la emoción del episodio.

La herramienta ya está disponible para todos los usuarios con cuenta de Microsoft. (Tomado de Cubadebate)