cours / présentation

03c - Désambiguïsation lexicale à base de connaissances par sélection distributionnelle et traits sémantiques (Article RECITAL) (taln2015)

Sessions orales TALN 2015 – Mardi 23 juin 2015 Session Désambiguïsation Désambiguïsation lexicale à base de connaissances par sélection distributionnelle et traits sémantiques (Article RECITAL) Mokhtar Boumedyen Billami Résumé : La désambiguïsation lexicale permet d’améliorer de nombreuses appl...

Date de création :

23.06.2015

Présentation

Informations pratiques

Langue du document : Français
Type : cours / présentation
Niveau : enseignement supérieur
Durée d'exécution : 30 minutes 33 secondes
Contenu : vidéo
Document : video/mp4
Poids : 146.510 Mo
Droits d'auteur : libre de droits, gratuit
Droits réservés à l'éditeur et aux auteurs.

Description de la ressource

Résumé

Sessions orales TALN 2015 – Mardi 23 juin 2015 Session Désambiguïsation Désambiguïsation lexicale à base de connaissances par sélection distributionnelle et traits sémantiques (Article RECITAL) Mokhtar Boumedyen Billami Résumé : La désambiguïsation lexicale permet d’améliorer de nombreuses applications en traitement automatique des langues (TAL) comme la recherche d’information, l’extraction d’information, la traduction automatique, ou la simplification lexicale de textes. Schématiquement, il s’agit de choisir quel est le sens le plus approprié pour chaque mot d’un texte. Une des approches classiques consiste à estimer la similarité sémantique qui existe entre les sens de deux mots puis de l’étendre à l’ensemble des mots du texte. La méthode la plus directe donne un score de similarité à toutes les paires de sens de mots puis choisit la chaîne de sens qui retourne le meilleur score (on imagine la complexité exponentielle liée à cette approche exhaustive). Dans cet article, nous proposons d’utiliser une méta-heuristique d’optimisation combinatoire qui consiste à choisir une fenêtre contenant les voisins les plus proches par sélection distributionnelle autour du mot à désambiguïser. Le test et l’évaluation de notre méthode portent sur un corpus écrit en langue française en se servant du réseau sémantique BabelNet. Le taux d’exactitude obtenu est de 78% sur l’ensemble des noms et des verbes choisis pour l’évaluation.

"Domaine(s)" et indice(s) Dewey

  • Traduction automatique (418.02)
  • Informatique appliquée à la linguistique (410.285)

Domaine(s)

  • Langues
  • Linguistique

Document(s) annexe(s)

Fiche technique

Identifiant de la fiche : 18182
Identifiant OAI-PMH : oai:canal-u.fr:18182
Schéma de la métadonnée : oai:uved:Cemagref-Marine-Protected-Areas
Entrepôt d'origine : Canal-U

Voir aussi

Canal-U
Canal-U
17.07.2015
Description : Sessions orales TALN 2015 – Mardi 23 juin 2015 Session Désambiguïsation Création rapide et efficace d’un système de désambiguïsation lexicale pour une langue peu dotée Mohammad Nasiruddin, Andon Tchechmedjiev, Hervé Blanchon et Didier Schwab Résumé : Cet article présente un modèle génératif ...
  • traitement automatique du langage naturel
  • taln2015
  • Désambiguïsation
Canal-U
Canal-U
23.06.2015
Description : Sessions orales TALN 2015 – Mardi 23 juin 2015 Session Désambiguïsation Désambiguïsation d’entités pour l’induction non supervisée de schémas événementiels Kiem-Hieu Nguyen, Xavier Tannier, Olivier Ferret et Romaric Besançon Résumé : Cet article présente un modèle génératif pour l’induction ...
  • traitement automatique du langage naturel
  • taln2015
  • Désambiguïsation