(Texte en français ci-dessous)
Thank-you for your request to pre-register or for information regarding the Paris 8 Summer Corpus Intensive.
As we receive many more requests than the number of places available, applications will be reviewed first to ensure that we have a group whose interests are largely compatible with one another. We'll keep you informed as soon as possible as to whether your application has been accepted, and how to enroll.
Classes will be held at the main Paris 8 campus in St. Denis (Metro station St. Denis Université).
The language used in classes will primarily be English, depending on participants' preferences (and language abilities). As we will be working with corpora in both English and French, knowledge of both languages will be an advantage, but not strictly necessary.
The overall schedule (subject to modifications between now and June) is roughly as follows: --mornings, 9:30-12:30, we'll start with a plain-text French corpus on Monday, then move to tagged corpora on Tues.-Wednesday, DIY corpus compilation on Wed.-Thurs. --afternoons, 14:00-17:00, the statistics classes will start out with the basics of loading data into R, performing a Chi2 analysis, and will depend to some extent on the work accomplished in the morning sessions and on the interests expressed by participants. --automatic and manual annotation workshops are planned for Thurs.-Fri.
Participants should plan bring their own computers and a list of software to pre-install will be sent in late May.
***
Merci pour votre demande de pré-inscription et/ou d'informations complémentaires concernant l'école d'été en Linguistique de Corpus de l'Université Paris 8.
Étant donné que le nombre de demandes dépasse toujours le nombre de places disponibles, nous chercherons à sélectionner parmi les candidatures un groupe de participants dont les intérêts seront compatibles entre eux. Nous vous tiendrons au courant dès que possible de la suite donnée à votre demande, et des modalités d'inscription.
Les séminaires se tiendront au campus principal de l'Université Paris 8 à St. Denis (M. St. Denis Université).
Les cours seront dispensés principalement en anglais selon les préférences (et compétences langagières) des participants. Dans la mesure où nous travaillerons sur des corpus en anglais et français, des compétences dans les deux langues pourraient s'avérer utiles mais ne seront pas absolument nécessaires.
Le planning provisionnel des séances (sous réserve de modification d'ici juin) sera grosso modo comme suit : --le matin, 9h30-12h30, nous commencerons par l'extraction et la préparation de données à partir d'un corpus de texte brut en français le lundi, puis commencerons à interroger des corpus étiquetés le mardi et le mercredi, pour terminer par des techniques de compilation le mercredi-jeudi. --l'après-midi, 14h00-17h00, les séminaires d'analyse statistique débuteront par l'importation des données dans R, l'analyse Chi2, et dépendront en partie du travail accompli dans les séances matinales et des intérêts exprimés par les participants eux-mêmes. --les ateliers d'annotation automatique et manuelle auront lieu le jeudi-vendredi.
Chaque participant devra apporter son propre ordinateur, en ayant installé au préalable une liste de logiciels qui sera communiquée fin mai.
Best regards, Meilleures salutations,
Daniel Henkel & Dylan Glynn