Apprentissage semi et faiblement supervisé pour de l’analyse vidéo

When:
31/12/2020 – 01/01/2021 all-day
2020-12-31T01:00:00+01:00
2021-01-01T01:00:00+01:00

Offre en lien avec l’Action/le Réseau : – — –/Doctorants

Laboratoire/Entreprise : SNCF
Durée : 6 mois
Contact : tony.marteau@sncf.fr
Date limite de publication : 2020-12-31

Contexte :
Au sein de SNCF Voyageurs, le Centre d’Ingénierie du Matériel réalise des missions d’expertise dans diverses spécialités lors de l’acquisition et la rénovation de matériels roulants. Intégré à l’équipe ETF1, le pôle « Intelligence Artificielle » expertise et conçoit des systèmes de vision artificielle ainsi que des solutions de surveillance audio et vidéo.

La problématique de disponibilité de jeu de données avec une labélisation forte pour entrainer de manière supervisé les modèles de deep learning est commune à tous les projets du pôle. L’acquisition de ce type de données est couteuse en temps et introduit des biais d’annotation. Pour contrer ces problématiques les modèles sont entrainés avec des données synthétiques ou scénarisées. Malheureusement, même si ce genre de données est intéressant pour valider la pertinence d’un modèle, ces données ne reprennent pas toute la diversité d’un environnement commercial.

Avant de pouvoir déployer les modèles en production il est donc nécessaire de les entrainer sur des données provenant de services commerciaux. La difficulté est que ces données sont soit faiblement labélisés ou partiellement labélisés. L’objectif de ce stage est donc d’évaluer et de mettre en place des approches faiblement et semi supervisé afin d’entrainer des modèles précédemment validé avec des entrainements supervisés.

Sujet :
Appliqué à un cas d’usage vidéo le stage aura pour but d’étudier deux approches afin d’évaluer les atouts, les faiblesses et la pertinence au regard du cas d’usage

1. Faiblement supervisé
2. Semi supervisé

Il sera nécessaire de se baser sur les travaux déjà menés dans le pôle et les techniques récentes dans la communauté scientifique.

La finalité du stage sera le développement d’un framework logiciel permettant d’entrainer facilement, sur des jeux de données faiblement ou partiellement annotés, des modèles validés via un entrainement supervisé.

Le stage sera découpé en trois parties :
– La première partie « littérature » permettra de découvrir les différentes approches et d’établir l’état de l’art dans le domaine
– La seconde partie « implémentation » sera l’application sur des cas d’usage SNCF des méthodes précédemment repérées
– Enfin la troisième et dernière partie sera dédiée au développement d’un framework afin de pouvoir entrainer tous les modèles

La publication en conférence sera possible et encouragé.

Concernant le matériel une unité de calcul équipé d’un GPU dernier cri (V100, RTX 8000, RTX 6000, Titan RTX, 2080Ti) sera mise à disposition du stagiaire pour évaluer ses implémentations.

Enfin des déplacements ponctuels sont prévus dans le cadre de certains essais ou réunions.

Profil du candidat :
Le stage s’adresse aux étudiants en Master 2 informatique ou traitement de signal ou en dernière année d’école d’ingénieur (BAC+5).

Le stagiaire devra faire preuve d’autonomie et d’initiative ainsi que d’un bon sens relationnel. Curiosité technique et un esprit de synthèse seront également nécessaires.

Formation et compétences requises :
Les compétences techniques ciblées pour ce stage sont :
– Système d’exploitation : Linux
– Langages : Python
– Librairies : OpenCV, TensorFlow ou PyTorch

Les compétences fonctionnelles suivantes sont demandées :
– Intelligence artificielle : Deep Learning (DNN, CNN, RNN)
– Computer Vision

Adresse d’emploi :
4 Allée des Gémeaux – 72100 LE MANS

Document attaché : 202010231149_2021-ApprentissageSemiSuperviséPourAnalyseVideo.pdf