ROSprite - CivArchive (CivitAI Archive)

ROSprite - v1.0

NSFW

Este modelo LoRa está diseñado para replicar el estilo clásico de los sprites de personajes del juego Ragnarok Online. Utilizando configuraciones estándar de kohya_ss, el modelo ha sido entrenado con un total de 250 imágenes de los sprites originales del juego. Se ha ajustado con 5 epochs, 3 repeticiones por imagen, buscando un balance adecuado entre calidad y fidelidad al estilo retro de píxeles del juego.

Cómo lo logré

Recolección de imágenes: Se obtuvieron 250 sprites de personajes de Ragnarok Online, asegurando una representación equilibrada de los distintos personajes y clases.
Configuración del entorno: Utilicé el repositorio kohya_ss con las configuraciones por defecto para entrenar LoRa. Aquí algunos pasos clave:
- Aprendizaje estándar: No modifiqué las configuraciones avanzadas, manteniendo una tasa de aprendizaje básica y un batch size adecuado.
- Número de epochs: Definí 5 epochs para lograr un buen balance entre entrenamiento eficiente y resultados precisos.
- Repeticiones: Se realizaron 3 repeticiones por imagen para garantizar que el modelo captara bien los detalles del estilo pixel art.
Entrenamiento: El proceso se llevó a cabo en un entorno con soporte para GPU, lo que permitió que el entrenamiento fuera más rápido y eficiente, obteniendo resultados consistentes sin overfitting.

Description

Mejoras para el Modelo LoRa: Personalización de Etiquetas

Aunque el modelo LoRa que creé funciona bien para replicar los sprites de Ragnarok Online, hay varias áreas en las que se puede mejorar, especialmente en la personalización de etiquetas para el entrenamiento. Al ajustar y optimizar las etiquetas, se puede lograr una mejor comprensión del estilo y una mayor precisión en los resultados generados. A continuación, algunas ideas para mejorar el proceso:

1. Uso de Etiquetas Personalizadas (Tagging)

En lugar de confiar únicamente en etiquetas básicas, puedes generar etiquetas más específicas para cada sprite o conjunto de imágenes. Herramientas como WD 1.4 Tagger pueden ayudarte a crear etiquetas más detalladas, lo cual le dará al modelo más contexto sobre qué elementos incluir o enfatizar. Aquí algunas sugerencias:

Características visuales específicas: Por ejemplo, detallar el color del cabello, el tipo de armadura, el arma que porta el personaje, y otros accesorios importantes.
Pose y perspectiva: Diferenciar si el personaje está en reposo, en combate, caminando, o en una posición de ataque.
Estilo del sprite: Etiquetas relacionadas con el tamaño de los píxeles, el esquema de color, o si es un sprite clásico o modificado.

2. Segmentación de las Imágenes por Categorías

Otra mejora clave sería dividir el conjunto de imágenes en subgrupos, asignando etiquetas específicas según las clases y tipos de personajes en Ragnarok Online. Esto ayudaría a que el modelo aprenda con mayor precisión sobre las diferencias estilísticas entre clases como:

Clases físicas: Swordman, Knight, Assassin, etc.
Clases mágicas: Wizard, Priest, Sage.
Clases mixtas: Hunter, Rogue.

Cada grupo podría tener etiquetas adicionales como "melee", "magical", "ranged", etc., para guiar mejor al modelo.

3. Ajuste Fino de las Etiquetas por Detalles de Animación

Para mejorar la precisión en detalles animados (caminatas, ataques), puedes etiquetar cada cuadro de sprite según su secuencia de movimiento:

Idle (Reposo): Cuando el personaje no está en acción.
Walk (Caminando): Diferenciando las posiciones de las piernas, brazos y el giro de la cabeza.
Attack (Ataque): Detallar las diferentes fases del ataque, la dirección y el uso del arma.

4. Automatización del Etiquetado con Scripts

Para manejar datasets grandes, es recomendable usar scripts que automaticen el proceso de etiquetado. Herramientas como BLIP o DeepBooru pueden sugerir etiquetas basadas en patrones que encuentran en las imágenes, facilitando el proceso.

5. Ajuste de Parámetros en el Entrenamiento

Finalmente, personaliza las etiquetas asegurándote de ajustar los parámetros de entrenamiento según el tipo de imágenes y la cantidad de etiquetas. Algunos aspectos a tener en cuenta:

Epochs y repeticiones: Para datasets más complejos con muchas etiquetas, considera aumentar los epochs o el número de repeticiones por imagen.
Uso de etiquetas negativas: Si ciertas características no deben aparecer, añade etiquetas negativas que ayuden al modelo a ignorarlas.