cours / présentation

02c - Apprentissage discriminant des modèles continus de traduction (taln2015)

Sessions orales TALN 2015 – Mardi 23 juin 2015 Session Traduction Apprentissage discriminant des modèles continus de traduction Quoc-Khanh Do, Alexandre Allauzen et François Yvon Résumé : Alors que les réseaux neuronaux occupent une place de plus en plus importante dans le traitement automatique ...

Date de création :

23.06.2015

Présentation

Informations pratiques

Langue du document : Français
Type : cours / présentation
Niveau : enseignement supérieur
Durée d'exécution : 27 minutes 15 secondes
Contenu : vidéo
Document : video/mp4
Poids : 116.23 Mo
Droits d'auteur : libre de droits, gratuit
Droits réservés à l'éditeur et aux auteurs.

Description de la ressource

Résumé

Sessions orales TALN 2015 – Mardi 23 juin 2015 Session Traduction Apprentissage discriminant des modèles continus de traduction Quoc-Khanh Do, Alexandre Allauzen et François Yvon Résumé : Alors que les réseaux neuronaux occupent une place de plus en plus importante dans le traitement automatique des langues, les méthodes d’apprentissage actuelles utilisent pour la plupart des critères qui sont décorrélés de l’application. Cet article propose un nouveau cadre d’apprentissage discriminant pour l’estimation des modèles continus de traduction. Ce cadre s’appuie sur la définition d’un critère d’optimisation permettant de prendre en compte d’une part la métrique utilisée pour l’évaluation de la traduction et d’autre part l’intégration de ces modèles au sein des systèmes de traduction automatique. De plus cette méthode d’apprentissage est comparée aux critères existants d’estimation que sont le maximum de vraisemblance et l’estimation contrastive bruitée. Les expériences menées sur la tâches de traduction des séminaires TED Talks de l’anglais vers le français montrent la pertinence d’un cadre discriminant d’apprentissage mais dont les performances sont liées au choix d’une stratégie d’initialisation adéquate. Nous montrons qu’avec une initialisation judicieuse des gains significatifs en terme de scorebleu peuvent être obtenus.

"Domaine(s)" et indice(s) Dewey

  • Traduction automatique (418.02)
  • Informatique appliquée à la linguistique (410.285)

Domaine(s)

  • Langues
  • Linguistique

Document(s) annexe(s)

Fiche technique

Identifiant de la fiche : 18179
Identifiant OAI-PMH : oai:canal-u.fr:18179
Schéma de la métadonnée : oai:uved:Cemagref-Marine-Protected-Areas
Entrepôt d'origine : Canal-U

Voir aussi

Canal-U
Canal-U
23.06.2015
Description : Sessions orales TALN 2015 – Mardi 23 juin 2015 Session Traduction Multi-alignement vs bi-alignement : à plusieurs, c’est mieux ! Olivier Kraif Résumé : Dans cet article, nous proposons une méthode originale destinée à effectuer l’alignement d’un corpus multi-parallèle, i.e. comportant plus ...
  • traduction
  • traitement automatique du langage naturel
  • taln2015
Canal-U
Canal-U
23.06.2015
Description : Sessions orales TALN 2015 – Mardi 23 juin 2015 Session Traduction Utilisation de mesures de confiance pour améliorer le décodage en traduction de parole Laurent Besacier, Benjamin Lecouteux et Luong Ngoc Quang Résumé : Les mesures de confiance au niveau mot (Word Confidence Estimation – WCE) ...
  • traduction
  • traitement automatique du langage naturel
  • taln2015