Soutenance de thèse de Rim ABROUGUI

Ecole Doctorale
Mathématiques et Informatique de Marseille
Spécialité
Informatique
établissement
Aix-Marseille Université
Mots Clés
compréhension du langage,représentation sémantique structurée,curation des données,données conversationnelles,multi-domaines,multi-intentions,
Keywords
language understanding,structured semantic representation,data curation,conversational dataset,multi-domains,multi-intents,
Titre de thèse
curation de corpus et représentations sémantiques structurées pour une compréhension contextuelle et complexe du langage naturel et parlé
corpus curation and structured semantic representations for contextual, complex natural and spoken language understanding
Date
Mardi 2 Avril 2024 à 14:00
Adresse
Faculté des Sciences Aix Marseille Université 163 Avenue de Luminy Case 901 13288 Marseille
Salle de conférence
Jury
Directeur de these M. Frédéric BECHET Aix Marseille Université - LIS
Rapporteur Mme Iris ESHKOL-TARAVELLA Université Paris Nanterre, - Laboratoire MODYCO UMR7114
Rapporteur M. Giuseppe RICCARDI University of Trento
Co-encadrant de these Mme Géraldine DAMNATI Orange Innovation Lannion
Examinateur Mme Nathalie CAMELIN Université du Mans
Examinateur M. Bassam JABAIAN Université d'AVIGNON
Président M. Alexis NASR AMU

Résumé de la thèse

La compréhension automatique du langage naturel, en raison de sa complexité, reste une problématique cruciale dans le domaine du Traitement Automatique du Langage Naturel (TAL). Dans cette thèse, nous nous sommes concentrés sur la Compréhension du Langage Naturel et Parlé au sein des systèmes de dialogue (N/SLU). Bien que le domaine couvre plusieurs niveaux d'étude, l'accent actuel des systèmes de dialogue est principalement mis sur la compréhension de la sémantique des requêtes des utilisateurs, y compris l'identification des intentions, connue sous le nom , Intent Identification et la reconnaissance des concepts génériques de mots-clés, connue sous le nom de Slot Filling. Cependant, ces systèmes sont souvent basés sur des jeux de données mono-domaine et mono-intent sans tirer parti du contexte. Puisque dans une conversation naturelle, un utilisateur peut exprimer plusieurs intentions en même temps à travers divers domaines, nous avons dépassé ce paradigme simple pour travailler avec des corpus multi-domaines et multi-intents. La problématique principale de cette étude tourne autour de comment représenter des jeux de données complexes pour effectuer une tâche de NLU qui peut couvrir le maximum d'informations sémantiques. En étudiant les défis associés à la qualité des jeux de données, à la curation des corpus, les différents schémas d'annotation, et les caractéristiques de complexité de ces corpus, nous proposons une représentation de graphe sémantique structurée qui peut représenter des jeux de données simples et complexes. Nous affirmons que cette représentation structurée peut relier les étiquettes ensemble et représenter la structure hiérarchique entre elles. La thèse postule que ce paradigme structuré, par la possibilité d'intégrer des détails sémantiques supplémentaires, est une meilleure présentation que les modèles traditionnels et peut améliorer la compréhension automatique du langage naturel. Cette hypothèse a été vérifiée en évaluant la projection structurée sur plusieurs corpora N/SLU en focalisant particulièrement sur un ensemble de données conversationnel, contextuel et multi-intentions.

Thesis resume

The challenge of automatic understanding of natural language, due to its complexity, remains a crucial challenge in Natural Language Processing field. In this thesis, we focused on Natural and Spoken Language Understanding within dialogue systems (N/SLU). While the field covers multiple levels of study, the current focus of dialogue systems includes understanding the semantics of user queries, along with identifying intentions, known as Intent identification, and recognizing generic concepts of keywords, known as Slot Filling. These systems, however, are often based on mono-domain and mono-intent datasets without taking advantage of the context. Since in a natural conversation, a user may express several intents at the same time across various domains, we have moved beyond this simple paradigm to work with multi-domains and multi-intents corpora. The main problematic of the research revolves around how to represent complex datasets to perform an NLU task that can cover the maximum of semantic information. By investigating the challenges associated with dataset quality and curation, different annotation schemes, and the complexity features of these corpora within N/SLU systems, we propose structured semantic graph representations that can represent simple and complex datasets. We claim that this structured representation of datasets can link labels together and represent hierarchical schemas. The thesis hypothesizes that this structured paradigm, by the possibility to integrate additional semantic details, is a better presentation than traditional ones and can improve the automatic understanding of natural language. This hypothesis was verified by evaluating the structured projection on several N/SLU corpora with a particular focus on conversational, contextual multi-intents dataset.