[Corpora-List] Summer Corpus Intensive PreRegistration

6 Mar 2023


      (Texte en français ci-dessous)
Thank-you for your request to pre-register or for information regarding 
the Paris 8 Summer Corpus Intensive.
As we receive many more requests than the number of places available, 
applications will be reviewed first to ensure that we have a group whose 
interests are largely compatible with one another.  We'll keep you 
informed as soon as possible as to whether your application has been 
accepted, and how to enroll.
Classes will be held at the main Paris 8 campus in St. Denis (Metro 
station St. Denis Université).
The language used in classes will primarily be English, depending on 
participants' preferences (and language abilities).  As we will be 
working with corpora in both English and French, knowledge of both 
languages will be an advantage, but not strictly necessary.
The overall schedule (subject to modifications between now and June) is 
roughly as follows:
--mornings, 9:30-12:30, we'll start with a plain-text French corpus on 
Monday, then move to tagged corpora on Tues.-Wednesday, DIY corpus 
compilation on Wed.-Thurs.
--afternoons, 14:00-17:00, the statistics classes will start out with 
the basics of loading data into R, performing a Chi2 analysis, and will 
depend to some extent on the work accomplished in the morning sessions 
and on the interests expressed by participants.
--automatic and manual annotation workshops are planned for Thurs.-Fri.
Participants should plan bring their own computers and a list of 
software to pre-install will be sent in late May.
***
Merci pour votre demande de pré-inscription et/ou d'informations 
complémentaires concernant l'école d'été en Linguistique de Corpus de 
l'Université Paris 8.
Étant donné que le nombre de demandes dépasse toujours le nombre de 
places disponibles, nous chercherons à sélectionner parmi les 
candidatures un groupe de participants dont les intérêts seront 
compatibles entre eux.  Nous vous tiendrons au courant dès que possible 
de la suite donnée à votre demande, et des modalités d'inscription.
Les séminaires se tiendront au campus principal de l'Université Paris 8 
à St. Denis (M. St. Denis Université).
Les cours seront dispensés principalement en anglais selon les 
préférences (et compétences langagières) des participants.  Dans la 
mesure où nous travaillerons sur des corpus en anglais et français, des 
compétences dans les deux langues pourraient s'avérer utiles mais ne 
seront pas absolument nécessaires.
Le planning provisionnel des séances (sous réserve de modification d'ici 
juin) sera grosso modo comme suit :
--le matin, 9h30-12h30, nous commencerons par l'extraction et la 
préparation de données à partir d'un corpus de texte brut en français le 
lundi, puis commencerons à interroger des corpus étiquetés le mardi et 
le mercredi, pour terminer par des techniques de compilation le 
mercredi-jeudi.
--l'après-midi, 14h00-17h00, les séminaires d'analyse statistique 
débuteront par l'importation des données dans R, l'analyse Chi2, et 
dépendront en partie du travail accompli dans les séances matinales et 
des intérêts exprimés par les participants eux-mêmes.
--les ateliers d'annotation automatique et manuelle auront lieu le 
jeudi-vendredi.
Chaque participant devra apporter son propre ordinateur, en ayant 
installé au préalable une liste de logiciels qui sera communiquée fin mai.
Best regards,
Meilleures salutations,
Daniel Henkel & Dylan Glynn

2026

2025

2024

2023

2022

[Corpora-List] Summer Corpus Intensive PreRegistration