-------- Forwarded Message --------
*ContribuLing 2021
(English) (French / Spanish versions below)*
There are significant
differences when it comes to the digitisation and
computational
processing of languages, which are the reflection of the
availability of
language-specific linguistic resources. In turn, this
significantly impacts
existing tools, whether they serve to build or
collect data - speech
recognition, OCR software, data collection (in
some specific
languages) or whether they are used to process data
(search engines,
encyclopedias, language learning, chatbots).
Given the situation,
numerous projects have been launched over the last
few years to make it
easier to produce and share linguistic resources.
The latter are mostly
geared towards data collection, e.g. speech or
text corpora,
dictionaries, glossaries or grammars. One of the major
challenges is to allow
everyone easy access to linguistic resource
platforms.
The ContribuLing project (https://meta.wikimedia.org/wiki/ContribuLing)
- a joint contribution
of INALCO, Wikimedia, BULAC and UQAM - will take
place on June 3rd/4th,
2021, either online or in Paris/Montreal
depending on the
situation. Its aim is to offer linguistic resource
platform managers an
opportunity to lay out their specs and stage
workshops that will
enable would-be users to contribute.
ContribuLing's main goal is to
ensure that the largest possible number
of contributors can use
the platforms. An additional benefit will be to
allow the emergence or
the development of user groups who share the
same tools or
platforms. Emphasis will not be laid on producing data
sets but on enabling
attendees to do so.
To offer some ContribuLing presentation/workshop,
please send a draft
poposal - 2 pages max.
- by April 27th to contribuling@framalistes.org.
Your proposal should
provide the following info:
- name(s), forename(s),
credentials of workshop organisers
- time needed for
workshop
- platform name
- language used for
workshop
- platform languages
currently available
- size of platform data
- platform and
lingusitic data type of licence
- bird's eye-view of
tool - 10 lines
- linguistic or
programing requisites
- platform access mode
-online, login ...
- specific needs for
workshop
- any info for seamless
workshop organisation
Using the above info, ContribuLing's organising committee
will look
into the proposals and
offer the selected platform managers time slots
with a view to setting
some tentative schedule. Once the schedule has
been agreed on, the ContribuLing project
will reach out to would-be
participants.
The project will
consist of presentations of tools and platforms that
can contribute to
improving how they are designed and used.
Language-specific
workshops will help would-be contributors to use
tools and platforms in
relation to specific languages.
*ContribuLing 2021
(Français)*
La disponibilité des
ressources numériques dans une langue a un impact
indéniable sur la
qualité des outils de traitement informatique
disponibles, autant
pour la création et l'acquisition de nouvelles
données (saisie / OCR /
reconnaissance de parole) que pour leur
traitement (moteurs de
recherche, encyclopédies, apprentissage des
langues, chatbots,
etc).
Face à ce constat, de
nombreux projets ont été initiés ces dernières
années pour faciliter
la contribution et le partage de ressources
linguistiques.
Il existe ainsi de
nombreuses plateformes permettant la collecte
directe de données
linguistiques, telles que des corpus oraux ou
écrits, des
dictionnaires et lexiques, des grammaires, etc. Les outils
de traitement
automatique des langues ayant besoin de données de tout
type et non
nécessairement spécialisées, tout locuteur est légitime
pour contribuer à
enrichir les bases de données pour sa langue. Ainsi,
actuellement, un des
enjeux est de permettre à tou·te·s de contribuer
efficacement sur ces
plateformes.
L'événement ContribuLing (https://meta.wikimedia.org/wiki/ContribuLing),
co-organisé par
l'INALCO, Wikimedia, la BULAC et l'UQAM les 3 et 4 juin
2021 entièrement en
ligne (ou si la situation le permet, également en
présentiel à Paris et à
Montréal), propose aux plateformes d’organiser
des conférences sur la
création et l’utilisation des outils qu’elles
ont mis en place, ainsi
que des ateliers à destination des
participant·e·s,
permettant de former de potentiel·le·s
contributeur·rice·s.
Il s'agit en premier
lieu de permettre au plus grand nombre de prendre
en main ces plateformes
pendant ces journées, afin qu'elles·ils puis
sent par la suite
contribuer en ligne. Nous espérons également que cet
événement permettra de
constituer ou renforcer des communautés
d'utilisateur·rice·s
autour des outils et des plateformes présentées.
Les ateliers n'auront
pas vocation à constituer des jeux de données au
cours de ces journées,
mais d'apporter aux participant·e·s la capacité
de le faire par la
suite.
Pour proposer une
présentation ou un atelier lors de ces journées, nous
vous prions de bien
vouloir nous envoyer votre proposition (maximum
deux pages) avant le 27
avril 2021 à l'adresse
contribuling@framalistes.org
avec, autant que
possible, les informations suivantes :
- noms, prénoms,
affiliation des organisateur-rice-s de l'atelier,
- durée envisagée
de l'atelier,
- nom de la
plateforme contributive,
- langue dans
laquelle sera présenté l'atelier,
- langues
actuellement prises en charge par la plateforme,
- volume des
données déjà présentes sur la plateforme,
- licence de la
plateforme (code) et des données linguistiques
collectées,
- description
sommaire de l'outil (10 lignes),
- modalités d'accès
à la plateforme (en ligne, authentification, etc.),
- prérequis de
compétences en informatique et/ou en linguistique,
- moyens
nécessaires à l'organisation de l'atelier,
- autres
informations liées à la bonne organisation de l'atelier.
À partir de ces
informations, le comité d'organisation de ContribuLing
examinera les
propositions d'ateliers et proposera aux ateliers retenus
des plages horaires
afin d'établir un programme sur les deux journées
concernées, l'annonce
de l'événement sera alors diffusée plus largement.
*ContribuLing 2021
(Español)*
La disponibilidad de
recursos digitales en una lengua tiene un impacto
indiscutible sobre la
calidad de las herramientas de tratamiento
informático para esa
lengua, tanto para la creación y adquisición de
nuevos datos (entrada
de [auto]texto, OCR, reconocimiento de voz) como
para su procesamiento
(motores de búsqueda, enciclopedias, aprendizaje
de lenguas, chatbots,
etc).
Ante esta situación, en
los últimos años se han iniciado numerosos
proyectos para
facilitar la contribución y el intercambio de recursos
lingüísticos. Varias
plataformas ya permiten a los usuarios compartir
datos lingüísticos como corpus
orales o escritos, diccionarios y
léxicos, gramáticas,
etc. Las herramientas de procesamiento automático
de lenguas necesitan
datos de todo tipo, no necesariamente
especializados; por
consiguiente cada hablante es legítimo para
contribuir a enriquecer
las bases de datos de su lengua. Por ello, uno
de los retos actuales
es permitir que todos puedan contribuir
eficazmente en estas
plataformas.
El evento ContribuLing (https://meta.wikimedia.org/wiki/ContribuLing),
coorganizado por el
INALCO, Wikimedia, la BULAC y la UQAM tendrá lugar
los días 3 y 4 de junio
de 2021 en línea (o si la situación lo permite,
también en presencial
en París y Montreal). Se ofrece a los
representantes de
plataformas colaborativas la oportunidad de organizar
conferencias sobre ésas
(utilización, método de trabajo, comunidad, etc),
así como proporcionar a
los participantes talleres de formación a su
utilización
colaborativa.
El objetivo principal
es que el mayor número posible de personas se
familiarice con las
herramientas de estas plataformas dentro del marco
de este evento, de
manera que luego puedan contribuir en línea.
También esperamos que
este encuentro permita constituir o fortalecer
comunidades de usuarios
en torno a las herramientas y plataformas
presentadas. Es de
notar que los talleres no tendrán como objetivo
constituir bases de
datos durante estos días, sino proporcionar a los
participantes la
posibilidad de hacerlo posteriormente.
Para proponer una
presentación y/o un taller, les invitamos a enviar su
propuesta (máximo dos
páginas) antes del 27 de abril de 2021 al correo
contribuling@framalistes.org con, en
la medida de lo posible, las
informaciones
siguientes:
- nombre, apellido,
afiliación de los organizadores del taller,
- duración prevista
del taller,
- nombre de la
plataforma contribuyente,
- idioma en el que
se presentará el taller,
- idiomas
actualmente soportados por la plataforma,
- volumen de datos
ya presente en la plataforma,
- licencia de la
plataforma (código) y de los datos lingüísticos
recogidos,
- breve descripción
de la herramienta (10 líneas),
- métodos de acceso
a la plataforma (en línea, autenticación, etc.),
- si se requieren
conocimientos informáticos y/o lingüísticos para el
uso de la
plataforma,
- recursos
necesarios para la organización del taller,
- cualquier otra
información necesaria para la buena organización
del taller.
A partir de estos
datos, el comité organizador de ContribuLing examinará
las propuestas de
talleres y propondrá franjas horarias para los
proyectos
seleccionados, con el fin de establecer en conjunto un
programa completo. Más
adelante, éste se difundirá ampliamente.
*Organising Committee*
Adélaide Calais
(Wikimedia France)
Claire Camberlein
(BULAC)
Johanna Cordova
(INALCO ERTIM)
Hugo Lopez (Wikimedia
France / LinguaLibre)
Damien Nouvel (INALCO
ERTIM)
Thérèse Ottawa
(Wikimedia Canada)
Lucas Prégaldiny
(Wikimédia France / Lingua Libre)
Fatiha Sadat (UQAM)
Anass Sedrati
(Wikimedia Maroc)
Emma Vadillo Quesada
(Wikimedia France / LinguaLibre)