Job : Ph.D. student (UClouvain) : CMesure: reliable and adaptive modeling of text readability in French as a foreign language
L'UCLouvain recherche
un chercheur ou une chercheuse pour un doctorat en traitement automatique du langage
- bourse de doctorat à temps plein (100%) pour une durée de quatre ans
- pour le Centre de traitement automatique du langage (Cental), de l'Institut langage et communication (ILC) à l’UCLouvain (Louvain-la-Neuve)
- entrée en fonction: 1er septembre 2023 (négociable)
Cette proposition de bourse de doctorat s’intègre dans le cadre d’un projet de recherche réalisé par le Centre de traitement automatique du langage (CENTAL, https://uclouvain.be/fr/instituts-recherche/ilc/cental), en collaboration avec FEI (France Éducation International, https://www.france-education-international.fr/).
Le projet visera à développer un modèle d’évaluation automatisé de la lisibilité des textes pour le français langue étrangère (FLE). Il s’agira d’évaluer comment des algorithmes d’intelligence artificielle poussés permettraient de rendre des formules de lisibilité plus personnalisées, notamment en prenant en compte le type de lecture pratiquée, le genre du texte et la langue maternelle du lecteur. Dans un second temps, le projet visera à intégrer cette formule adaptative au sein d’un moteur de recherche pédagogique de textes en FLE, dont la pertinence des résultats sera évaluée par des professionnels du FLE.
Ce projet bénéficie de plusieurs atouts. D’une part, il est ancré au sein d’un laboratoire dans les recherches en lisibilité sont reconnus internationalement. D’autre part, il profitera d’un partenariat stratégique avec France Éducation Internationale et d’un accès à des textes utilisés pour les examens certificatifs du DELF et du DALF, textes calibrés sur l’échelle du cadre européen commun de référence pour les langues (CECR). Cela constituera en un point de départ pour l’élaboration d’un modèle de lisibilité pour le FLE qui soit (1) plus fiable, car entraîné sur des données rigoureusement calibrées, et qui permette (2) d’explorer une question fondamentale en lisibilité, mais jamais étudiée à notre connaissance : l’impact de la langue maternelle sur les modèles, ainsi que celui du genre de texte et du type de lecture.
Au sein de projet, le rôle du doctorant ou de la doctorante engagé consistera à mener l’essentiel de la recherche, à savoir (1) développer de nouvelles variables de lisibilité aptes à prendre en compte les caractéristiques pédagogiques et de genre des textes analysés ; (2) mettre au point un modèle machine learning (classique et/ou deep learning) non adaptatif à partir des textes du DELF et du DALF ; (3) mettre au point un modèle adaptatif et le comparer à sa version non adaptative et (4) intégrer ce modèle de lisibilité au sein d’un moteur de recherche adaptatif. Le chercheur ou la chercheuse devra également assurer la diffusion des résultats obtenus via des publications scientifiques et rédiger une thèse de doctorat. Il ou elle sera amené à collaborer étroitement avec les autres membres de l’équipe en vue d’assurer la bonne réalisation de ces tâches.
Environment de travail :
Le CENTAL est rattaché à l’Institut Langage & Communication (https://uclouvain.be/fr/instituts-recherche/ilc), qui fait partie de l’UCLouvain. Cette université est située à Louvain-la-Neuve (https://uclouvain.be/fr/sites/louvain-la-neuve), une ville piétonne, agréable à vivre et très dynamique. Le projet de recherche sera réalisé sous la direction du Pr. Thomas François (https://thomasfrancoisucl.wixsite.com/homepage), expert en lisibilité et en simplification automatique de la langue. Des missions à Paris (Sèvres) sont prévues afin d’assurer une bonne collaboration avec FEI. Cet organisme est mondialement reconnu pour son expertise dans le domaine de l’évaluation des niveaux de compétence en français langue étrangère (FLE) et est en charge de l’organisation des principaux tests de langues en français, à savoir le TCF, le DELF, ou le DAFL.
Qualifications et aptitudes requises
Le candidat répondra aux qualifications suivantes :
* Être porteur d’un master en Linguistique computationelle, en Traitement automatique du langage (TAL), ou en Informatique (option en Intelligence artificielle).
* Faire montre d’un excellent parcours académique
* Disposer de bonnes compétences informatiques :
* langages de programmation : Python, R (ou similaire)
* la connaissance de scikit-learn, pandas, tensorflow/keras et/ou pytorch
* systèmes : Linux de préférence
* Bonne connaissance des principaux outils et algorithmes du TAL. La connaissance des réseaux de neurones profonds est un plus.
* Excellente maîtrise du français (niveau C1 minimum) et bonne connaissance de l’anglais (niveau B2 minimum)
* Autonomie, curiosité, sens du travail en équipe, capacité d’écoute et d’analyse des besoins, réactivité.
Conditions d’engagement :
Cette bourse de doctorat est soumise aux conditions suivantes :
* À la date d’engagement, le doctorant doit être titulaire depuis au maximum 3 ans* d’un grade académique de master 120 crédits ou d’un grade reconnu comme équivalent.
* Le montant net de la bourse est d’environ 2 370 euros par mois.
* Le délai maximum fixé ci-dessus est augmenté d’une année par accouchement et/ou par adoption.
Dossier de candidature :
Date limite de remise du dossier : 22 juin
Si vous êtes intéressé par ce poste, merci d'envoyer votre dossier de candidature à Thomas François par mail (thomas.francois@uclouvain.be). Celui-ci devra inclure :
1. un curriculum vitae détaillé en français ou anglais reprenant les différentes qualifications et aptitudes requises, les détails de votre parcours académique (grades, listes de cours), ainsi que les éventuelles publications et autres expériences académiques et scientifiques ;
2. une lettre de motivation en français, décrivant votre intérêt pour le poste, comment votre profil répond à la description du poste et aux objectifs du projet, etc. (maximum 2 pages) ;
3. une lettre de référence en français ou en anglais de la part d’un ou d’une de vos professeur(e)s.
Les candidats retenus seront invités à participer à un entretien via vidéo-conférence selon des modalités qui leur seront ensuite transmises par mail.
Plus d'informations :
Les questions concernant le poste ou la procédure de candidature doivent être envoyées par e-mail à Thomas François (thomas.francois@uclouvain.be) avant le 15 juin.
Pr. Thomas François
Chargé de cours en linguistique appliquée Faculté de Philosophie, Arts et Lettres Université catholique de Louvain Institut Langage et Communication, PLIN, CENTAL et TeaMM Place Montesquieu, 3 - box L2.06.04 • B-1348 Louvain-la-Neuve • Belgium Tél. : +32 (0)10 / 47 37 36