SY32 : Vision et Apprentissage

Les objectifs de SY32 sont d'abord de comprendre les différents moyens de former des images, pour ensuite choisir et appliquer un traitement de vision adapté au problème donné. Cette UV est organisée en deux parties dominantes, nous abordons les algorithmes fondamentaux de la vision par ordinateur, puis appliquons l'intelligence artificielle et l'apprentissage machine à des problèmes de vision.
SY32 inclut des projets à rendre, avec un accent fort sur l'analyse et l'évaluation des résultats, pour apporter une approche scientifique à l'UV.

Enseignants :

Julien Moreau (responsable)
Insaf Setitra

Programme

1e partie, Concepts classiques :

Des ondes à la perception, de la vision aux caméras [J. Moreau]
Mouvement et flot optique [J. Moreau]
Transformations géométriques et alignement d’images [J. Moreau]
Calibrage/étalonnage géométrique de caméra [J. Moreau]
Stéréovision, géométrie épipolaire et mise en correspondance 3D [J. Moreau]
Estimation automatique de transformations [J. Moreau]

2e partie, Méthodes d'apprentissage :

Vision et apprentissage [I. Setitra]
Méthodes d’apprentissage automatique pour la classification [I. Setitra]
Caractéristiques visuelles [I. Setitra]
Détection d’objets [I. Setitra]
Apprentissage profond [I. Setitra]
Réseaux de neurones convolutifs [I. Setitra]
CNN et détection, segmentation, autres applications [I. Setitra]

Un planning détaillé est disponible dans le Moodle SY32.

Travaux pratiques

Les exercices sont à coder en langage Python avec la bibliothèque NumPy (ainsi que d'autres).
Les développements peuvent être faits sur les ordinateurs de la salle de TP.
Ou bien, => guide de configuration Python

Liste des travaux pratiques :

Stéganographie
Éléments de traitement d’images
Flot optique
Transformations géométriques
Étalonnage des distorsions géométriques
Stéréovision
Apprentissage automatique
Adaboost
Classification de visages
Évaluation d'un détecteur
Classification d'images
Apprentissage profond
Réseaux de neurones convolutifs

Modalités d'évaluation

Médian : 25%
Final : 25%
Projets : 50%

Deux projets sont prévus :

Mise en correspondance stéréo (en lien avec les concepts classiques)
Détection (par méthode d'apprentissage)

Ils sont évalués, par ordre d'importance, sur le compte-rendu, l'implémentation et l'originalité de l'algorithme choisi, et la qualité des résultats.

Autres informations

Pré-requis :
Connaissances de bases en mathématiques et en algèbre, géométrie 2D et 3D (tel que les coorodonnées et transformations homogènes, les changements de repère…), en statistiques.
Initiation au traitement du signal souhaité (domaine fréquentiel et transformées de Fourier, produit de convolution).
Python pour les sciences (NumPy etc) et Linux nécessaires.

Niveau : GI04

Volume horaire hebdomadaire : 2h CM, 3h TP/TD.