Photographie et Intelligence Artificielle

Principes de la génération d’images par intelligence artificielle :

  1. Apprentissage et création de modèle
    Lors de la phase d’apprentissage des dizaines de millions d’images associées chacune à un texte descriptif sont compilées dans un modèle pour former une sorte d'”imaginaire artificiel” décrivant un univers pictural.
    Il est possible, par un apprentissage complémentaire avec ses propres images, d’introduire des personnes et des objets dans un modèle pour le personnaliser.
  2. Génération d’images
    En puisant dans le modèle, les images sont générées à partir de textes (prompt décrivant l’idée de l’image souhaitée, prompt négatif pour ce qu’on ne souhaite pas) et, éventuellement, d’une image qui agira plus ou moins sur la structure de l’image finale.
    L’introduction d’un modèle complémentaire (LoRA) permet en outre d’agir sur le rendu des images plus ou moins photographique.

 

Echange d’expérience :

  • Easy Diffusion (Philippe B) : Stable Diffusion installé gratuitement sur un PC (disposant de
    préférence d’une GPU de 8Go de VRAM).
    L’avantage est de pouvoir choisir ses modèles et de produire plusieurs images sur la même calcul.
    Le site Civitai.com montre des exemples d’images avec leurs paramètres (modèles prompt) et offre la possibilité de télécharger des modèles.
    L’ensemble Edge/Bing/Copilot (ex ChatGPT) permet de générer un prompt en anglais en demandant la description d’une image.
    Kohya est un environnement d’apprentissage de modèles. Son installation sur PC nécessite d’être familier avec l’environnement de développement Python.

d’après “The Destroyed Room”, Jeff Wall, 1978 et “La Mort de Sardanapale”, Eugène Delacroix, 1827

  • Pixart-Alpha (Pierre-Marie A) : en ligne, offre l’avantage de ne pas limiter le nombre d’images générées quotidiennement.
  • Leonardo (Philippe d G) : en ligne mais donne des possibilités de paramétrage proches d’Easy Diffusion (choix du modèle, modèle complémentaire, image source, …).
    Un système de jetons (token) limite le nombre d’images générées à un activité amateur soit une centaine d’images quotidiennement.
    Un espace communautaire donne des exemples d’images accompagnés de leurs paramètres de création.
    A explorer plus en détail dans le cadre du club.

 

IA_et_Photo_v7-1