- The paper presents a novel unsupervised FSAC method that integrates facial-body fusion with spatial-temporal clustering to improve manga character re-identification accuracy.
- It employs a two-module approach combining a face-body graph to counter artistic deformations with a spatial-temporal triplet loss for precise clustering.
- Experiments on 109 manga volumes demonstrate the method's superior performance compared to traditional re-identification approaches.
La tarea de "Unsupervised Manga Character Re-identification" (Re-identificación No Supervisada de Personajes de Manga) a través de "Face-body and Spatial-temporal Associated Clustering" aborda un problema interesante y desafiante en el campo de la inteligencia artificial aplicada al reconocimiento de personajes en cómics japoneses.
El artÃculo "Unsupervised Manga Character Re-identification via Face-body and Spatial-temporal Associated Clustering" presenta un método novedoso conocido como FSAC (Face-body and Spatial-temporal Associated Clustering). La idea básica de este método es utilizar tanto la combinación de caracterÃsticas de la cara y el cuerpo como las relaciones espaciales y temporales para mejorar la precisión en la identificación de personajes de manga, especialmente dado el gran volumen de datos sin etiqueta disponible en este ámbito (2204.04621).
El enfoque FSAC se compone de dos módulos principales:
- Módulo de combinación de cara y cuerpo: Se construye un grafo que combina los rasgos faciales y corporales para mitigar problemas de exageraciones y deformaciones debido al estilo artÃstico. Esto usa la integridad de la imagen en su totalidad para mejorar la precisión de identificación.
- Corrección de relaciones espaciales-temporales: Se analizan las caracterÃsticas de apariencia de los personajes, y se diseña una pérdida de triplete relacionada con el espacio y el tiempo para afinar aún más el agrupamiento y mejorar la precisión.
Este método se probó extensamente en un conjunto de datos de mangas que comprende 109 volúmenes, demostrando su superioridad en la reidentificación no supervisada de personajes de manga.
El campo de re-identificación de personajes presenta varios retos comparables con la re-identificación de personas, un área bien investigada en la visión por computadora. Otros trabajos relevantes en re-identificación de personas incluyen diversos enfoques para mejorar la precisión en entornos no supervisados y adaptativos. Ejemplos son el uso del aprendizaje incremental y la transferencia de patrones espaciales-temporales (Fan et al., 2017, Li et al., 2017), asà como el uso de representaciones de partes del cuerpo alineadas y la atención regularizada en el dominio espacial-temporal (Zhao et al., 2017, Li et al., 2018).
Estos enfoques, si bien están orientados hacia la re-identificación de personas, comparten principios fundamentales que también pueden ser aplicables a la re-identificación de personajes en mangas, tales como la necesidad de mitigar variaciones en apariencia y pose, asà como la utilización de relaciones espaciales y temporales para mejorar la precisión.