Descubre Pony Diffusion, uno de los mejores modelos XL

por Mitsuha Kitsune · Publicada 14 agosto, 2024 · Actualizado 20 agosto, 2024

Los modelos Diffusion se encuentran en constante evolución, mucha gente se está animando a entrenar sus LoRA y sus modelos refinados, lo cuál hace que la comunidad contribuya modelos realmente increíbles.

Hoy vengo a presentar Pony Diffusion, un modelo refinado sobre Stable Diffusion XL, pero con diversas diferencias que lo hacen bajo mi opinión, uno de los mejores modelos de Stable Diffusion hasta la fecha, además, la calidad de las imágenes que es capaz de generar es realmente buena.

Table of Contents

Características

El modelo Pony es muy versátil en cuanto a todo, ya que ha sido entrenado con mas de 2,6 millones imágenes con prácticamente un etiquetado perfecto, es un modelo ideal al uso para cualquier tipo de arte digital y un buen modelo base para entrenar cualquier LoRA o hacer finetune sobre el mismo, siempre y cuando no busquemos foto realismo.

Está basado en el modelo XL de Stable Diffusion, por lo que cuenta con todas sus ventajas, como una mayor definición en las imágenes, así como una mejor anatomía en los cuerpos generados, entre muchas más.

Pony nos brinda una diversidad de estilos y una lista enorme de personajes conocidos incluidos en el modelo base, por lo que es capaz de generar diferentes estilos o incluir un personaje conocido sin necesidad de utilizar ningún LoRA.

Como punto negativo, aunque se base de un modelo XL, ningún LoRA de XL es compatible con Pony, estos generarán un ruido extraño como resultado. Es necesario que los LoRA estén entrenados específicamente para ser compatibles con Pony.

¿Cómo conseguirlo?

Pony es un modelo gratuito y disponible para toda la comunidad, puedes descargar el modelo base original o cualquier derivado del original, que básicamente son mezclas, modelos refinados en un estilo o temática concreta y sus modelos LoRA compatibles.

Ya existen modelos basados en Pony refinados en foto realismo, puedes echar un vistazo al enlace de derivados que he dejado en el párrafo anterior.

Instrucciones de uso

El uso de los modelos Pony, dista un poco del uso convencional de los modelos XL, ya que ha sido entrenado de una forma diferente, por lo que es importante tener en cuenta las siguientes instrucciones para alcanzar los mejores resultados en nuestras imágenes.

Calidad

A diferencia de los modelos 1.5 y XL cuando les incluimos las etiquetas «masterpiece, high quality, absurd res quality…» en el prompt, los modelos Pony utilizan una clasificación de calidad mediante puntuación.

Las puntuaciones van desde 9 a 1, siendo 9 las de mejor calidad y 1 las de peor calidad, sin embargo, a día de hoy en la versión 6, se produjo un error durante su entrenamiento que provocó que las imágenes de mejor calidad se mezclaran entre los score 9 y 6 incluídos, por lo que debemos incluirlos en el prompt hasta que corrijan el error en la versión 7.

Realizando un análisis en varias galerías de arte AI, las mejores imágenes fueron generadas con el siguiente comienzo en el prompt positivo:

score_9, score_8_up, score_7_up, {resto del prompt positivo}

Esto hará que tome como referencia las mejores imágenes de su entrenamiento, para evitar que se cuelen imágenes de menor calidad, agregamos también las siguientes palabras al prompt negativo:

score_6, score_5, score_4, {resto del prompt negativo}

Puedes ahorrarte las típicas etiquetas empleadas en otros modelos, como «masterpiece, high quality…» estas no tendrán ningún efecto en los modelos Pony.

Recuerda que puedes crear un estilo que ya incluya estas palabras por ti y ahorrarte el tener que escribirlas en cada imagen.

Conceptos

El modelo Pony es muy versátil y es capaz de generar diferentes conceptos de imagen, debemos especificar en el prompt que tipo de concepto deseamos generar mediante la palabra «source», siendo esta la lista disponible:

source_pony: Para generar imágenes de ponys, unicornios, etc etc… estilo «My Little Pony»
source_anime: Para un estilo de anime japonés
source_cartoon: Para un estilo de dibujos animados occidental o tipo comic americano
source_furry: Para generar imágenes de furries

Clasificación de contenido

Los modelos Pony disponen también de un sistema de clasificación por contenido, lo cuál nos permitirá generar imágenes totalmente seguras, hasta las más explicitas mediante la etiqueta «rating», esta es la lista de las clasificaciones disponibles:

rating_safe: Imágenes totalmente seguras (SFW)
rating_questionable: Nivel intermedio, sugerentes pero sin llegar a ser explícitas
rating_explicit: Imágenes totalmente explicitas (NSFW y R18)

El resto de etiquetas para el prompt, no dejan de ser similares a cualquier otro modelo, simplemente cambian las especificadas anteriormente.

Si necesitas una pequeña guía sobre las diferentes etiquetas, puedes fijarte en los prompt de otras imágenes generadas o consultar las listas de etiquetas de cualquier booru.

Descubre Pony Diffusion, uno de los mejores modelos XL

Características

¿Cómo conseguirlo?