(Texte en français ci-dessous)
Paris 8 University is pleased to announce their upcoming Summer
Intensive Program "*Corpus Methods in Linguistics--compilation,
annotation, and quantitative analysis*", to be held 26-29 May 2026.
This will be a 30h week-long course consisting of:
--morning sessions devoted to data collection, extraction and
organization, as well as DIY corpus building
--afternoon sessions focusing on statistical analysis of the data
produced during the morning sessions
--several half-day sessions on automatic annotation and manual
annotation methods
Participants will learn how to:
--formulate advanced search queries in a concordancer (e.g. TextSTAT,
AntConc)
--compile a text corpus with BootCaT
--automatically annotate a text corpus in TreeTagger
--measure keyword specificity and collocation strength using AntConc
--perform statistical analyses of categorical variables in R
This program is intended primarily for researchers and upper-level
students (Masters or Doctorate). Tuition will be 90€. To participate*,
or request further information, please send an email to the organizers
indicating name, status (e.g. Doctoral student, Post-doctoral
researcher, Faculty) and 5 keywords describing your research interests
using this link
<mailto:daniel.henkel@univ-paris8.fr?subject=Summer%20Corpus%20Intensive&body=Name:%0D%0A%0D%0AStatus%2FAffiliation:%0D%0A%0D%0AKeywords:%0D%0A%0D%0AHow%2FWhere%20did%20you%20learn%20about%20the%20Paris%208%20Summer%20Corpus%20Intensive%3F:%0D%0A%0D%0AMessage:%0D%0A%0D%0A%0D%0ANB.%20Please%20leave%20the%20subject%20line%20%22Summer%20Corpus%20Intensive%22%20unchanged.%0D%0AVeuillez%20ne%20pas%20modifier%20la%20ligne%20objet%20%22Summer%20Corpus%20Intensive%22.&cc=dsg.up8@gmail.com,summer.school.paris8@gmail.com>.
Please note that this is an international Summer School and that we will
work with corpora in English, French and possibly other languages.
Knowledge of French is thus an advantage but is not strictly necessary.
/*Pending confirmation/
***
Nous avons le plaisir de vous annoncer l'ouverture prochaine du
Séminaire Intensif « *Méthodes en Linguistique de Corpus--compilation,
annotation et analyse quantitative* », de l'Université Paris 8 qui aura
lieu du 26 au 29 mai 2026.
Ce programme, d'une durée d'une semaine, comprend 30h de cours répartis
de la manière suivante :
--le matin, des séances consacrées à la récolte et à la préparation des
données
--l'après-midi, des cours dédiés à l'analyse statistique des données
récoltées lors des séances du matin
--plusieurs demi-journées d'entraînement à l'annotation automatique et
manuelle.
Les participants apprendront à :
--concevoir des formules de recherche complexes dans un concordancier
(p.ex. TextSTAT, AntConc)
--rassembler un corpus thématique avec BootCaT
--étiqueter un corpus de texte automatiquement avec TreeTagger
--mesurer la spécificité des mots clefs et la force des collocations
dans AntConc
--réaliser des analyses statistiques de variables catégoriques dans R
Ce programme s'adresse principalement à des enseignants-chercheurs et
étudiants de deuxième ou troisième cycle (Master, Doctorat). Les frais
de participation seront de 90€. Pour y participer*, ou pour tout
complément d'information, envoyez un courriel aux organisateurs
indiquant votre nom, statut (p.ex. Doctorant, Post-doc,
Enseignant-chercheur) et 5 mots clefs décrivant vos intérêts de
recherche en cliquant ici
<mailto:daniel.henkel@univ-paris8.fr?subject=Summer%20Corpus%20Intensive&body=Name:%0D%0A%0D%0AStatus%2FAffiliation:%0D%0A%0D%0AKeywords:%0D%0A%0D%0AHow%2FWhere%20did%20you%20learn%20about%20the%20Paris%208%20Summer%20Corpus%20Intensive%3F:%0D%0A%0D%0AMessage:%0D%0A%0D%0A%0D%0ANB.%20Please%20leave%20the%20subject%20line%20%22Summer%20Corpus%20Intensive%22%20unchanged.%0D%0AVeuillez%20ne%20pas%20modifier%20la%20ligne%20objet%20%22Summer%20Corpus%20Intensive%22.&cc=dsg.up8@gmail.com,summer.school.paris8@gmail.com>.
/*Sous réserve de confirmation/