(Texte en français ci-dessous)
Thank-you for your request to pre-register or for information regarding
the Paris 8 Summer Corpus Intensive.
As we receive many more requests than the number of places available,
applications will be reviewed first to ensure that we have a group whose
interests are largely compatible with one another. We'll keep you
informed as soon as possible as to whether your application has been
accepted, and how to enroll.
Classes will be held at the main Paris 8 campus in St. Denis (Metro
station St. Denis Université).
The language used in classes will primarily be English, depending on
participants' preferences (and language abilities). As we will be
working with corpora in both English and French, knowledge of both
languages will be an advantage, but not strictly necessary.
The overall schedule (subject to modifications between now and June) is
roughly as follows:
--mornings, 9:30-12:30, we'll start with a plain-text French corpus on
Monday, then move to tagged corpora on Tues.-Wednesday, DIY corpus
compilation on Wed.-Thurs.
--afternoons, 14:00-17:00, the statistics classes will start out with
the basics of loading data into R, performing a Chi2 analysis, and will
depend to some extent on the work accomplished in the morning sessions
and on the interests expressed by participants.
--automatic and manual annotation workshops are planned for Thurs.-Fri.
Participants should plan bring their own computers and a list of
software to pre-install will be sent in late May.
***
Merci pour votre demande de pré-inscription et/ou d'informations
complémentaires concernant l'école d'été en Linguistique de Corpus de
l'Université Paris 8.
Étant donné que le nombre de demandes dépasse toujours le nombre de
places disponibles, nous chercherons à sélectionner parmi les
candidatures un groupe de participants dont les intérêts seront
compatibles entre eux. Nous vous tiendrons au courant dès que possible
de la suite donnée à votre demande, et des modalités d'inscription.
Les séminaires se tiendront au campus principal de l'Université Paris 8
à St. Denis (M. St. Denis Université).
Les cours seront dispensés principalement en anglais selon les
préférences (et compétences langagières) des participants. Dans la
mesure où nous travaillerons sur des corpus en anglais et français, des
compétences dans les deux langues pourraient s'avérer utiles mais ne
seront pas absolument nécessaires.
Le planning provisionnel des séances (sous réserve de modification d'ici
juin) sera grosso modo comme suit :
--le matin, 9h30-12h30, nous commencerons par l'extraction et la
préparation de données à partir d'un corpus de texte brut en français le
lundi, puis commencerons à interroger des corpus étiquetés le mardi et
le mercredi, pour terminer par des techniques de compilation le
mercredi-jeudi.
--l'après-midi, 14h00-17h00, les séminaires d'analyse statistique
débuteront par l'importation des données dans R, l'analyse Chi2, et
dépendront en partie du travail accompli dans les séances matinales et
des intérêts exprimés par les participants eux-mêmes.
--les ateliers d'annotation automatique et manuelle auront lieu le
jeudi-vendredi.
Chaque participant devra apporter son propre ordinateur, en ayant
installé au préalable une liste de logiciels qui sera communiquée fin mai.
Best regards,
Meilleures salutations,
Daniel Henkel & Dylan Glynn