genetic-images/report/report.org

13 KiB
Raw Blame History

Création dimages par algorithme génétique avec référence

Sujet

Le sujet de ce projet est la création dun logiciel pouvant recréer une image fournie grâce à des générations aléatoires et successives de formes aux, positions, couleurs et taille aléatoires. Lalgorithme commence par créer une image vide aux dimensions identiques à limage de référence, puis applique une de ces formes aléatoires. Si la ressemblance de limage ainsi générée augmente par rapport à sa version précédente par rapport à limage de référence, alors cette modification est conservée, sinon elle est annulée. Répéter jusquà satisfaction.

Les méthodes utilisées

Plusieurs approches au problème sont possibles, allant de la simple implémentation naïve du problème à des moyen pouvant au moins décupler la vitesse de génération de limage. Sauf indication contraire, jai utilisé dans limplémentation de chaque méthode des carrés comme forme déléments appliqués aléatoirement à limage.

Pour évaluer la ressemblance entre deux image, jévalue une distance euclidienne entre le vecteur de leurs pixels qui peut se résumer à ceci :

V étant le vecteur de pixels de limage de référence, W étant le vecteur de pixels de limage générée, et n la taille de ces deux vecteurs.

Les tests de temps sont réalisés sur un Lenovo Ideapad Y700, disposant dun processeur Intel® Core™ i7-6700HQ à 2.6GHz et un turbo à 3.5GHz, composé de quatre cœurs supportant chacun deux threads, et de 16Go de RAM. Le programme est compilé avec les options doptimisation -O3 et -flto.

Voici également ci-dessous la liste des options et arguments possibles concernant lexécution du logiciel.

  $ ./bin/genetic-image -h
  Allowed options:
    -h [ --help ]           Display this help message
    -i [ --input ] arg      Input image
    -o [ --output ] arg     Image output path (default: input path + "_output")
    -m [ --method ] arg     Method number to be used (default: 1)
    -n [ --iterations ] arg Number of iterations (default: 5000)
    -v [ --verbose ]        Enables verbosity

Voici le script grâce auquel les valeurs de temps dexécution ont été obtenues :

Quelques-unes de ces lignes commençasont là uniquement pour de la mise en forme des données afin que je puisse

Méthode naïve

Jai tout dabord implémenté la méthode naïve afin davoir une référence en matière de temps. Cette dernière est implémentée dans src/methods.cc avec la fonction method1(). Comme ce à quoi je mattendais, cette méthode de génération dimages est très lente, principalement dû au fait que lalgorithme en létat essaiera dappliquer des couleurs nexistant pas dans limage de référence, voire complètement à lopposées de la palette de couleurs de limage de référence.

Voici les moyennes de temps dexécution selon le nombre ditérations réussies sur le nombre dexécutions indiqué.

/ < <
Nb daméliorations Nb dexécutions Temps dexécution (s)
10 200 0.065881
50 100 0.130041
100 50 0.186012
200 20 0.385982
500 10 1.437486
1000 5 3.608983

Naturellement, la variation en temps dexécution croît en même temps que le nombre daméliorations nécessaires à apporter à limage à améliorer, dû à la nature aléatoire de lalgorithme. Cependant, on constate également une croissance importante du temps dexécution suivant également ce nombre ditérations réussies.

Vous trouverez en Annexes (§/phundrak/genetic-images/src/commit/4201e5476e83626681b0f6e553c2e4116f91c241/report/%2AM%C3%A9thode%201) un exemple dimage générée à partir de img/mahakala-monochrome.png avec 2000 améliorations via cette méthode.

Réduction du panel des couleurs

Constatant que la majorité des échecs dajout de formes de couleur par la première méthode échouent dû à une couleur incorrecte, voire nappartenant pas à limage de référence, jai décidé de restreindre les possibilités de couleurs parmis lesquelles le hasard peut choisir à la liste des couleurs présentes dans limage de référence uniquement. Ce choix se fait donc via limplémentation dun set de valeurs uniques représentant les couleurs trouvées dans limage de référence, leur détection étant réalisée avec des threads parallèles pour plus de rapidité à lexécution. Cette méthode est celle implémentée dans la fonction method2() dans src/methods.cc.

Voici les moyennes de temps dexécution selon le nombre ditérations réussies sur le nombre dexécutions indiqué.

/ < <
Nb daméliorations Nb dexécutions Temps dexécution (s)
10 200 0.072979
50 100 0.114426
100 50 0.157965
200 20 0.290475
500 10 0.785426
1000 5 2.664046

On peut remarquer une amélioration quant à la rapidité dexécution du logiciel. Cependant, le résultat nest pas aussi important quescompté. Je suppose que cela est dû au fait que lalgorithme précédent peut considérer un rapprochement dune zone déjà colorée vers la couleur dorigine comme une amélioration, avec une possibilité plus large sur ce plan-là que pour le second algorithme qui se doit dêtre plus précis concernant les couleurs. Une nette amélioration du résultat est toutefois visibles, voir Annexes (§/phundrak/genetic-images/src/commit/4201e5476e83626681b0f6e553c2e4116f91c241/report/%2AM%C3%A9thode%202) pour une image générée à partir de img/mahakala-monochrome.png via la méthode 2 et avec 2000 améliorations.

Étant donné que cette modification ne sera à priori pas en conflit avec dautres méthodes, cette amélioration sera conservée pour toutes les autres avancées suivantes.

Une taille des formes aléatoire mais contrôlée

Une autre méthode peut être de contrôler la taille des éléments en spécifiant une taille minimale et maximale selon le nombre déléments posés et le nombre total déléments à poser. Ainsi, on pourrait privilégier tout dabord de grandes formes en début de génération pour encourager petit à petit les formes à réduire en taille. Cela permettrait dobtenir rapidement une représentation grossière de limage pour ensuite pouvoir progressivement afiner les détails. La taille de la forme à appliquer est définie comme suit :

Voici les moyennes de temps dexécution selon le nombre ditérations réussies sur le nombre dexécutions indiqué.

/ < <
Nb daméliorations Nb dexécutions Temps dexécution (s)
10 200 0.082068
50 100 0.244236
100 50 0.418075
200 20 1.453703
500 10 4.777205
1000 5 20.33209

Cette version du logiciel est nettement plus lente que ses versions précédentes du fait de la contrainte de taille pour les formes pouvant potentiellement améliorer limage, cependant la qualité des images générées est plus haute que celle des version précédentes, voir en Annexes (§/phundrak/genetic-images/src/commit/4201e5476e83626681b0f6e553c2e4116f91c241/report/%2AM%C3%A9thode%203).

Cette méthode ne me semble que moyennement concluante, certes la vitesse dexécution du logiciel est beaucoup plus faible, mais il est également vrai que la qualité des images générées est supérieure aux deux autres méthodes. Ainsi, il sera possible dutiliser les modifications apportées par cette méthode en utilisant une option -s [ --size ] avec les méthodes suivantes pour activer cette modification de lalgorithme.

Concurrence entre threads

Une utilisation de calculs parallèles pourrait être intéressante afin daccélerer la génération des images : lutilisation de threads mis en concurrence. À chaque tentative damélioration de limage, plusieurs threads sont lancés, et chacun créera sa propre amélioration possible de limage. Ces résultats sont récupérés et évalués, et parmi les résultats améliorant limage générée, celle avec le meilleur score est conservée. Cela permet ainsi de multiplier les chances davoir une amélioration de limage par tentative.

Voici les benchmarks dexécution de cette méthode sans contrôle de la taille des formes aléatoires :

/ < <
Nb daméliorations Nb dexécutions Temps dexécution (s)
10 200 0.080525
50 100 0.139892
100 50 0.169113
200 20 0.273342
500 10 0.610812
1000 5 1.403816

Et voici les benchmarks dexécution de cette même méthode avec contrôle de la taille des formes aléatoires :

/ < <
Nb daméliorations Nb dexécutions Temps dexécution (s)
10 200 0.085981
50 100 0.156099
100 50 0.29183
200 20 0.59844
500 10 2.513782
1000 5 6.457168

Pour résumer, ces deux tableaux montrent la parallélisation de la seconde méthode et de la troisième méthode respectivement via des threads concurrentiels. On peut remarquer que le temps dexécution sest nettement amélioré, avec un temps dexécution à peu près deux fois plus rapide pour lexécution sans contrôle de taille des formes que la seconde méthode, et pouvant être jusquà trois fois plus rapide que la troisième méthode avec le contrôle de la taille des formes activée. On a donc une véritable amélioration significative avec cette nouvelle version parallèle.

Collaboration entre threads

Une différente approche au parallélisme peut être réalisée : plutôt que dessayer de mettre en concurrence plusieurs threads, il serait possible dessayer de plutôt les mettre en collaboration. Cela implique par exemple de diviser limage dentrée en plusieurs zones sur laquelle chacun des threads lancés travailleraient, appliquant chacun le nombre daméliorations demandé sur sa zone dédiée. Puis, une fois que chacun des threads a terminé son travail, les différentes zones sont unifiées en une seule image.

Annexes

Images

Image de référence

/phundrak/genetic-images/media/commit/4201e5476e83626681b0f6e553c2e4116f91c241/img/mahakala-monochrome.jpg
Image de référence utilisée pour les tests du logiciel

Méthode 1

/phundrak/genetic-images/media/commit/4201e5476e83626681b0f6e553c2e4116f91c241/report/output1.png
Image générée à partir de img/mahakala-monochrome.png avec 2000 améliorations avec la première méthode

Méthode 2

/phundrak/genetic-images/media/commit/4201e5476e83626681b0f6e553c2e4116f91c241/report/output2.png
Image générée à partir de img/mahakala-monochrome.png avec 2000 améliorations avec la seconde méthode

Méthode 3

/phundrak/genetic-images/media/commit/4201e5476e83626681b0f6e553c2e4116f91c241/report/output3.png
Image générée à partir de img/mahakala-monochrome.png avec 2000 améliorations avec la troisième méthode

Méthode 4

Taille des formes non contrôlée
/phundrak/genetic-images/media/commit/4201e5476e83626681b0f6e553c2e4116f91c241/report/output4-1.png
Image générée à partir de img/mahakala-monochrome.png avec 2000 améliorations avec la quatrième méthode sans loption -s
Taille des formes contrôlée
/phundrak/genetic-images/media/commit/4201e5476e83626681b0f6e553c2e4116f91c241/report/output4-2.png
Image générée à partir de img/mahakala-monochrome.png avec 2000 améliorations avec la quatrième méthode avec loption -s