Job : Ph.D. student (UClouvain ) : iRead4skills : Intelligent Reading Improvement System for Fundamental and Transversal Skills Development
L'UCLouvain recherche
un chercheur ou une chercheuse pour un doctorat en traitement automatique du langage
- bourse de doctorat à temps plein (100%) pour une durée de deux ans
- pour le Centre de traitement automatique du langage (CENTAL), de l'Institut langage et communication (ILC) à l’UCLouvain (Louvain-la-Neuve)
- entrée en fonction: 1er mars 2024 (négociable)
Cette proposition de bourse de doctorat s’intègre dans le cadre du projet Européen iRead4Skills - Système intelligent d’amélioration de la lecture pour le développement des compétences fondamentales et transversales (https://iread4skills.com/fr/). Il s’agit d’un projet de recherche et d’innovation financé par la Commission européenne : HORIZON-CL2-2022-TRANSFORMATIONS-01-07, réalisé en collaboration avec 8 partenaires disséminés en Espagne, au Portugal et en Belgique. Le chercheur ou la chercheuse recruté sera intégré dans l’équipe du Centre de traitement automatique du langage (CENTAL, https://uclouvain.be/fr/instituts-recherche/ilc/cental)https://uclouvain.be/fr/instituts-recherche/ilc/cental)%C3%A0 à Louvain-la-Neuve (Belgique).
Le projet iRead4Skills vise àpromouvoir le développement des compétences en lecture chez des adultes faibles lecteurs à travers un système intelligent innovant qui évalue la complexité des textes et suggère des lectures adaptées au niveau de l’utilisateur. Le système pourra également être utilisé par les formateurs pour la sélection ou l’adaptation de textes d’un niveau de complexité approprié pour leurs étudiants. Enfin, via la production d’un diagnostic précis sur les lieux de difficulté des textes, le système pourra servir pour l’assistance à la simplification des textes. Le projet se situe donc à l’intersection entre les domaines de la lisibilité, de la simplification automatique de textes et de l’enseignement de la lecture à des faibles lecteurs. Un calendrier des objectifs du projet est disponible sur le site (https://iread4skills.com/fr/activites/#calendrier-projet).
Ce projet bénéficie de plusieurs atouts. D’une part, il est ancré au sein d’un laboratoire dont les recherches en lisibilité et en simplification automatique de textes sont reconnues internationalement. D’autre part, il s’inscrit dans un solide consortium regroupant des experts représentatifs des différentes disciplines nécessaires à la bonne réalisation du projet.
Au sein de projet, le rôle du doctorant ou de la doctorante engagé(e) consistera à mener la partie des recherches qui concerne surtout le développement des outils de lisibilité, à savoir (1) développer de nouvelles métriques de lisibilité aptes à prendre en compte les caractéristiques pédagogiques spécifiques au public des faibles lecteurs et illettrés ; (2) mettre au point un modèle machine learning (classique et/ou deep learning) sur la base d’un corpus de textes dont la difficulté globale et de certains éléments textuels aura été annotés par des professeurs et des faibles lecteurs. La quantité de données étant relativement limitée, la personne engagée sera aussi amenée à explorer des pistes basées sur les larges modèles de langue et le few-shot. Ensuite, (3) sur la base de cette annotation, il s’agira de participer au développement de l’outil diagnostic permettant d’identifier les segments difficiles à lire dans un texte et (4) d’intégrer ce modèle de lisibilité au sein d’un prototype disponible sur un site web. Le chercheur ou la chercheuse devra également assurer la diffusion des résultats obtenus via des publications scientifiques et rédiger une thèse de doctorat. Il ou elle sera amené à collaborer étroitement avec les autres membres de l’équipe en vue d’assurer la bonne réalisation de ces tâches. Quelques missions sont aussi prévues dans les universités partenaires, afin d’assurer une bonne collaboration au sein du consortium. Un budget est également prévu pour des déplacements en conférence pour les publications scientifiques en lien avec le projet.
Environment de travail
Le CENTAL est rattaché à l’Institut Langage & Communication (https://uclouvain.be/fr/instituts-recherche/ilc), qui fait partie de l’UCLouvain. Cette université est située à Louvain-la-Neuve (https://uclouvain.be/fr/sites/louvain-la-neuve), une ville piétonne, agréable à vivre et très dynamique. Le projet de recherche sera réalisé sous la direction du Pr. Thomas François (https://cental.uclouvain.be/team/tfrancois/), expert en lisibilité et en simplification automatique de la langue.
Qualifications et aptitudes requises
Le candidat répondra aux qualifications suivantes :
* Être porteur d’un master en Linguistique computationelle, en Traitement automatique du langage (TAL), ou en Informatique (option en Intelligence artificielle).
* Faire montre d’un excellent parcours académique
* Disposer de bonnes compétences informatiques :
* langages de programmation : Python, R (ou similaire)
* la connaissance de scikit-learn, pandas, tensorflow/keras et/ou pytorch
* systèmes : Linux de préférence
* Bonne connaissance des principaux outils et algorithmes du TAL. La connaissance des réseaux de neurones profonds est un plus.
* Excellente maîtrise du français (niveau C1 minimum) et bonne connaissance de l’anglais (niveau B2 minimum)
* Une expérience pédagogique dans le domaine du français langue étrangère ou de l’alphabétisation est un plus.
* Autonomie, curiosité, sens du travail en équipe, capacité d’écoute et d’analyse des besoins, réactivité.
Conditions d’engagement :
Cette bourse de doctorat est soumise aux conditions suivantes :
* À la date d’engagement, le doctorant doit être titulaire depuis au maximum 3 ans* d’un grade académique de master 120 crédits ou d’un grade reconnu comme équivalent.
* Le montant net de la bourse est d’environ 2 370 euros par mois.
* Le doctorant devra se domicilier en Belgique pour des raisons légales.
Important : le financement actuel est prévu pour 2 ans et devra être complété afin de permettre l’achèvement de la thèse, prévue sur 4 années. Pour ce faire, le chercheur sera amené à candidater à des financements en vue de compléter cette bourse et sera soutenu par le laboratoire dans cette optique.
* Le délai maximum fixé ci-dessus est augmenté d’une année par accouchement et/ou par adoption.
Dossier de candidature :
Date limite de remise du dossier : 20 février
Si vous êtes intéressé par ce poste, merci d'envoyer votre dossier de candidature à Thomas François par mail (thomas.francois@uclouvain.bemailto:thomas.francois@uclouvain.be). Celui-ci devra inclure :
1. un curriculum vitae détaillé en français ou anglais reprenant les différentes qualifications et aptitudes requises, les détails de votre parcours académique (grades, listes de cours), ainsi que les éventuelles publications et autres expériences académiques et scientifiques ;
2. une lettre de motivation en français, décrivant votre intérêt pour le poste, comment votre profil répond à la description du poste et aux objectifs du projet, etc. (maximum 2 pages) ;
3. une lettre de référence en français ou en anglais de la part d’un ou d’une de vos professeur(e)s.
Les candidats retenus seront invités à participer à un entretien via vidéo-conférence selon des modalités qui leur seront ensuite transmises par mail.
Plus d'informations :
Les questions concernant le poste ou la procédure de candidature doivent être envoyées par e-mail à Thomas François (thomas.francois@uclouvain.bemailto:thomas.francois@uclouvain.be) avant le 20 février.
Thomas François
Chargé de cours en linguistique appliquée Faculté de Philosophie, Arts et Lettres Université catholique de Louvain Institut Langage et Communication, PLIN, CENTAL et TeaMM Place Montesquieu, 3 - box L2.06.04 • B-1348 Louvain-la-Neuve • Belgium Tél. : +32 (0)10 / 47 37 36