cours / présentation

Knowledge transfer and human-machine collaboration for training object class detector

Object class detection is a central area of computer vision. It requires recognizing and localizing all objects of predefined set of classes in an image. Detectors are usually trained under full supervision, which requires manually drawing object bounding-boxes in a large number of training imag...

Date de création :

28.06.2018

Auteur(s) :

Vittorio FERRARI

Présentation

Informations pratiques

Langue du document : Anglais
Type : cours / présentation
Niveau : master, doctorat
Durée d'exécution : 47 minutes 25 secondes
Contenu : vidéo
Document : video/mp4
Poids : 213.610 Mo
Droits d'auteur : libre de droits, gratuit
Droits réservés à l'éditeur et aux auteurs.

Description de la ressource

Résumé

Object class detection is a central area of computer vision. It requires recognizing and localizing all objects of predefined set of classes in an image. Detectors are usually trained under full supervision, which requires manually drawing object bounding-boxes in a large number of training images. This is tedious and very time consuming.  In this talk I will present two recent techniques for reducing this effort. In the first part I will explore a knowledge transfer scenario: training object detectors for target classes with only image-level labels, helped by a set of source classes with bounding-box annotations. I will present a unified knowledge transfer framework based on training a single neural network multi-class object detector over all source classes, organized in a semantic hierarchy. This generates proposals with scores at multiple levels in the hierarchy, which we use to explore knowledge transfer over a broad range of generality, ranging from class-specific (bicycle to motorbike) to class-generic (objectness to any class).  Experiments on 200 object classes from the ILSVRC 2013 dataset demonstrate large improvements over weakly supervised baselines. Moreover, we also carry out several across-dataset knowledge transfer experiments, which establish the general applicability of our method In the second part I will consider a human-machine collaboration scenario, where a human interacts with a computer model to carry the bounding-box annotation process together. I will introduce Intelligent Annotation Dialogs: we train an agent to automatically choose a sequence of actions for a human annotator to produce a bounding box in a minimal amount of time. We consider two actions: box verification, where the annotator verifies a box generated by an object detector, and manual box drawing. We explore two kinds of agents, one based on predicting the probability that a box will be positively verified, and the other based on reinforcement learning. We experimentally demonstrate that our agents are able to learn efficient annotation strategies in several scenarios, automatically adapting to the image difficulty, the desired quality of the boxes, and the detector strength.

"Domaine(s)" et indice(s) Dewey

  • Reconnaissance des formes par ordinateur (006.4)
  • Vision par ordinateur (006.37)

Domaine(s)

  • Informatique
  • Reconnaissance optique et acoustique des formes, synthèse des sons
  • Informatique
  • Vision, perception

Intervenants, édition et diffusion

Intervenants

Fournisseur(s) de contenus : INRIA (Institut national de recherche en informatique et automatique), CNRS - Centre National de la Recherche Scientifique, UNS

Édition

  • INRIA (Institut national de recherche en informatique et automatique)

Diffusion

Cette ressource vous est proposée par :Canal-U - accédez au site internet

Document(s) annexe(s)

Fiche technique

Identifiant de la fiche : 42385
Identifiant OAI-PMH : oai:canal-u.fr:42385
Schéma de la métadonnée : oai:uved:Cemagref-Marine-Protected-Areas
Entrepôt d'origine : Canal-U

Voir aussi

UNIT
UNIT
20.11.2007
Description : Une machine peut-elle être intelligente ? C’est la question à laquelle tente de répondre Jean-Paul Haton, l’un des spécialistes français de l’intelligence artificielle.
  • podcast
  • interaction homme-machine
  • décision
  • apprentissage
  • fuscia
Canal-U
Canal-U
18.12.2013
Description : Anatole Lecuyer présente les trois défis scienfifiques qui sont au coeur du domaine de la réalité virtuelle et que son équipe de recherche tente de résoudre : Comment modéliser et simuler le monde en 3D, en virtuel et en temps réel ? la question se pose de simuler de manière physique et réaliste ...
  • réalité virtuelle
  • Interaction Homme-Machine