En los últimos años, la inteligencia artificial está experimentando un enorme crecimiento y ha adquirido mucho protagonismo en prácticamente todos los sectores, por esto mismo estamos seguros de que habrás oído hablar de OpenAI, ChatGPT o DALL-E (si no has leído el artículo que creamos desde Online Zebra sobre ChatGPT, te lo dejamos para que le eches un vistazo).
Hoy, vamos a explicarte sin dar muchos rodeos, qué es DALL-E, cómo funciona, cómo usarlo y algunos ejemplos interesantes de los resultados que ofrece este sistema.
¿Qué es DALL-E?
DALL-E es una herramienta de inteligencia artificial, capaz de crear imágenes originales a partir de una descripción en formato de texto, realizada por el usuario. Este sistema ha sido creado por OpenAI, los creadores del famoso ChatGPT.
OpenAI presentó su primera versión de DALL-E en 2021, esta versión fue implementando una serie de mejoras que dieron lugar al lanzamiento de su segunda y actual versión, DALL-E2, con una capacidad mejorada, rendimiento optimizado y mayor resolución en la creación de imágenes.
Durante el año pasado esta última versión pasó por una fase de prueba solo disponible para algunos usuarios, lo que provocaba que hubiera una lista de espera infinita para probar la herramienta, ya que cualquiera podía solicitar su uso y todos nos moríamos por hacerlo. Esto cambió a partir de finales de año ya que la versión beta se hizo pública, permitiendo que actualmente cualquiera se pueda registrar de forma gratuita y probar en ese mismo momento el funcionamiento de este innovador sistema.
¿Cómo funciona?
Para entender cómo funciona DALL-E, tenemos que explicar su base. Esta forma de inteligencia artificial está basada en el lenguaje GPT-3, es decir, está entrenada con millones de parámetros que le permiten entender a la perfección el lenguaje natural para interpretar los códigos que utilizamos al describir las imágenes que queremos generar, además de trabajar con una amplia biblioteca de materiales gráficos como obras artísticas o fotografías, lo que permite al sistema crear imágenes desde cero combinando diferentes factores y atributos.
Obviamente DALL-E tiene algunas limitaciones y es que por seguridad no genera imágenes con personajes famosos, desnudos, o violencia, ya que al reconocer e identificar celebridades, obras de arte o lugares, sería muy fácil usarlo para fines poco éticos y para asegurarse sus creadores han puesto ciertos límites que se pueden consultar aquí.
Como en otras IA similares de generación de imágenes, su proceso de creación puede explicarse en tres pasos: En el primero, interpreta y codifica el texto que el usuario introduce como petición, tratando de entender lo que se le está pidiendo, además de distinguir las características y estilos de esa petición.
Después, el sistema analiza la información que se va utilizar para crear la imagen y posteriormente utiliza un decodificador que pone en marcha la creación de la imagen en sí. Por este motivo, en cada petición, aunque sea igual, el resultado puede variar, ya que el sistema vuelve a procesar toda la información de cero pasando de nuevo por estas tres fases.
¿Cómo se usa?
- Para poder usar DALL-E, tienes que entrar en este link y registrarte.
- Una vez que lo hagas, se te enviará un código de verificación a tu dispositivo móvil, que tendrás que introducir en la casilla correspondiente.
- Al terminar estos sencillos pasos, ya tendrías cuenta en OpenAI, esta misma cuenta te servirá para acceder tanto a DALL-E como a CHAT-GPT.
- En DALL-E nada más registrarte, tendrás unos 50 créditos gratuitos que te permitirán realizar varias búsquedas (en cada una, gastarás un crédito). Para empezar, solo tendrás que insertar el texto en la barra superior que aparece en la pantalla y pulsar sobre “Generate” o “generar”.
- Pasados unos segundos, debajo de la barra te aparecerán 4 imágenes creadas a partir de tu texto. Si no estás conforme con estas imágenes o no terminan de cuadrar con la idea que tenías, puedes volver repetir el proceso con el mismo texto, o introducir más detalles y la plataforma te volverá a generar otras 4 imágenes nuevas.
Otra de las funcionalidades que tiene y que no es tan conocida como la principal, es que puedes editar imágenes que tu hayas subido y añadir objetos o modificar su estilo. Para ello solo tendrás que pulsar en la opción de “upload image” o “subir imagen” que se encuentra justo debajo de la barra donde introducimos el texto y se desplegará un pequeño menú con diferentes opciones de edición que te permitirá añadir y transformar los elementos que quieras.
Ejemplos:
Como no podía ser de otra forma, nos moríamos de curiosidad por probar la herramienta, por lo que ya hemos estado investigando y probando con diferentes estilos, ya que otra de las características que tiene, es que si además de describir la imagen le indicas que quieres que este sea del estilo X, por ejemplo 3D, pintura… el sistema te devolverá imágenes basándose en ese estilo o técnica.
La clave siempre será dar el máximo de detalles posibles en la descripción de texto, sobre todo si tienes una idea clara de las imágenes que necesitas que genere. Cuantos más detalles des, más fácil será que la imagen que cree se acerque a la imagen que tenías en mente.
A continuación te vamos a dejar algunos de los ejemplos más interesantes que hemos podido general, y algunos que te muestra el sistema para demostrar el enorme potencial que tiene la plataforma.
Si quieres conocer más acerca de la inteligencia artificial, ChatGPT, DALL-E y otras herramientas, no puedes perderte nuestro blog. ¡Descubre todas las novedades!
0 comentarios