
Sommaire
02c - Apprentissage discriminant des modèles continus de traduction (taln2015)
Date de création :
23.06.2015Présentation
Informations pratiques
Droits réservés à l'éditeur et aux auteurs.
Description de la ressource
Résumé
Sessions orales TALN 2015 – Mardi 23 juin 2015 Session Traduction Apprentissage discriminant des modèles continus de traduction Quoc-Khanh Do, Alexandre Allauzen et François Yvon Résumé : Alors que les réseaux neuronaux occupent une place de plus en plus importante dans le traitement automatique des langues, les méthodes d’apprentissage actuelles utilisent pour la plupart des critères qui sont décorrélés de l’application. Cet article propose un nouveau cadre d’apprentissage discriminant pour l’estimation des modèles continus de traduction. Ce cadre s’appuie sur la définition d’un critère d’optimisation permettant de prendre en compte d’une part la métrique utilisée pour l’évaluation de la traduction et d’autre part l’intégration de ces modèles au sein des systèmes de traduction automatique. De plus cette méthode d’apprentissage est comparée aux critères existants d’estimation que sont le maximum de vraisemblance et l’estimation contrastive bruitée. Les expériences menées sur la tâches de traduction des séminaires TED Talks de l’anglais vers le français montrent la pertinence d’un cadre discriminant d’apprentissage mais dont les performances sont liées au choix d’une stratégie d’initialisation adéquate. Nous montrons qu’avec une initialisation judicieuse des gains significatifs en terme de scorebleu peuvent être obtenus.
"Domaine(s)" et indice(s) Dewey
- Traduction automatique (418.02)
- Informatique appliquée à la linguistique (410.285)
Domaine(s)
- Langues
- Linguistique
Document(s) annexe(s)
- Cette ressource fait partie de
Fiche technique
- LOMv1.0
- LOMFRv1.0
- Voir la fiche XML