> Début du message réexpédié :
>
> De: dbernhard(a)unistra.fr
> Objet: Extended deadline, May 25: Special Issue of the TAL Journal on "NLP for Under-Resourced Languages" (59:3)
> Date: 18 mai 2018 11:05:08 UTC+2
> À: Laurent Besacier <laurent.besacier(a)univ-grenoble-alpes.fr>
>
> **The new submission deadline is: May 25, 2018**
>
> Call for Papers, Special Issue of the TAL Journal on "NLP for Under-Resourced Languages"
>
> Appel à contributions, numéro spécial de la revue TAL "Traitement automatique des langues peu dotées"
>
> tal-59-3.sciencesconf.org
>
> (see French version below)
>
>
> NLP for Under-Resourced Languages
>
> Until recently, most of the research work in Natural Language Processing
> (NLP) has been focused on a few well-described languages with many
> speakers. The lack of interest for other "under-resourced" languages and
> language varieties can be accounted for by a variety of reasons: lack of
> funding, of human resources, of appropriate technology, of complete and
> precise linguistic descriptions, of academic recognition by the
> scientific community, etc. Under-resourced languages nevertheless pose
> important scientific challenges, which open avenues of progress for NLP
> in general. First, at a time when state-of-the-art methods usually
> require large amounts of annotated data, work on under-resourced
> languages often imposes methods able to deal with small-sized datasets
> (small data). Second, given the difficulty of finding resources such as
> lexicons or corpora, the collected datasets are often very heterogeneous
> with respect to the time, space or domain parameters, e.g. corpora of
> texts corresponding to different geolinguistic varieties and different
> topics at different time points. This also often involves dealing with
> variation in the writing, due either to an evolution of spelling
> standards in time or also to the lack of spelling standards for
> languages or language varieties which are mostly oral and only seldom
> written. Third, NLP for under-resourced languages tends to be carried
> out in isolated or sparse research groups, and the resulting products
> are often in different formats and standards. Discovering, accessing,
> and making those resources interoperable so that they can be reused can
> become a challenge in itself. When dealing with under-resourced
> languages, issues of interoperability of data and metadata become of
> crucial importance for combining and re-using the few resources and
> tools that might be available.
>
> The goal of this issue of Traitement Automatique des Langues (TAL) is to
> give an overview of current research on NLP for under-resourced
> languages from all over the world, encompassing a large variety of tasks.
>
> Authors are invited to submit original papers on all aspects of NLP for
> under-resourced languages, in particular regarding, but not limited to,
> the following issues and tasks:
>
> - Methods for the acquisition, collection and elicitation of resources
> and annotations (e.g., OCR, crowdsourcing, etc.), for textual or spoken data
> - Spelling normalisation and character-level models for spelling variation
> - Projection of annotations from closely-related languages and
> cross-lingual models
> - Methods to deal with data sparsity, low quality issues and
> out-of-vocabulary words
> - Language and language variety identification, in particular for short
> texts and mixed language texts with code-switching
> - Computer-assisted language learning and writing aids (spelling
> correction, predictive text and word completion)
> - Issues related to reusability of NLP tools, techniques and resources
> for languages other than those originally targeted, with special concern
> for interoperability and reusability of resources and tools
> - Computational approaches for under-resourced and endangered languages
> documentation
>
> We also invite authors to provide a short but accurate description of
> the languages or language varieties under study, focusing both on their
> linguistic and sociolinguistic characteristics:
>
> - Brief history, location of current speakers ;
> - Main linguistic properties (morphology, syntax) and language family ;
> - Writing system ;
> - Vitality, approximate number of speakers, and contexts of use.
>
> IMPORTANT DATES
>
> - Submission deadline : May 25, 2018
> - Notification to authors after the first review: July 16, 2018
> - Notification to authors after the second review: September 30, 2018
> - Final version: November 30, 2018
> - Publication: January 2019
>
> THE JOURNAL
>
> TAL (Traitement Automatique des Langues / Natural Language Processing)
> is an international journal published by ATALA (French Association for
> Natural Language Processing, http://www.atala.org) since 1960 with the
> support of CNRS. It is now published online, with an immediate open
> access to published papers, and annual print on demand. This does not
> change its editorial and reviewing process.
>
> LANGUAGE
>
> Manuscripts may be submitted in English or French. French-speaking
> authors are requested to submit their contributions in French.
>
> SUBMISSION FORMAT
>
> Papers must be between 20 and 25 pages. Authors should contact the
> editors for a derogation on the length.
>
> Authors who intend to submit a paper are encouraged to upload their
> contribution via the menu "Paper submission" (PDF format). To do so,
> they will need to have an account on the sciencesconf platform. To
> create an account, go to the site http://www.sciencesconf.org and click
> on "create account" next to the "Connect" button at the top of the page.
> To submit, come back to the page http://tal-59-3.sciencesconf.org/,
> connect to your account and upload your submission.
>
> From now on, TAL will perform double-blind review: it is thus necessary
> to anonymise the manuscript and the name of the pdf file.
>
> Style sheets are available for download on the Web site of the journal:
> http://old.atala.org/English-style-files
>
> ************************************************************************
> French Version
> ************************************************************************
>
> Jusqu'à récemment, la plupart des travaux de recherche en Traitement
> Automatique des Langues (TAL) se sont concentrés sur quelques langues
> bien décrites et ayant de nombreux locuteurs. Le manque d'intérêt pour
> d'autres langues et variétés linguistiques «sous-dotées» peut
> s'expliquer par différentes raisons : manque de financement, de
> ressources humaines, de technologie appropriée, de descriptions
> linguistiques complètes et précises, de reconnaissance académique par la
> communauté scientifique, etc. Les langues sous-dotées posent néanmoins
> d'importants défis scientifiques qui ouvrent des pistes de progrès pour
> le TAL en général. Premièrement, à une époque où les méthodes de l'état
> de l'art nécessitent généralement de grandes quantités de données
> annotées, le travail sur des langues sous-dotées impose souvent des
> méthodes capables de traiter des jeux de données de petite taille (small
> data). Deuxièmement, compte tenu des difficultés à trouver des
> ressources telles que des lexiques ou des corpus, les données collectées
> sont souvent très hétérogènes et correspondent à différentes époques,
> aires linguistiques ou domaines, par exemple des corpus de textes
> intégrant différentes variétés géolinguistiques et portant sur
> différents sujets à différentes époques. Cette hétérogénéité implique
> aussi souvent des variations dans la graphie, dues soit à une évolution
> des normes orthographiques dans le temps, soit à l'absence de normes
> orthographiques pour les langues ou les variétés linguistiques qui sont
> essentiellement orales et rarement écrites. Troisièmement, les travaux
> de TAL pour les langues sous-dotées ont tendance à être réalisés dans
> des groupes de recherche isolés ou dispersés, et les ressources
> produites utilisent souvent des formats et des normes différents.
> Trouver ces ressources, y accéder et les rendre interopérables pour
> qu'elles puissent être réutilisées peut devenir un défi en soi. Quand il
> s'agit de langues sous-dotées, les questions d'interopérabilité des
> données et des métadonnées deviennent d'une importance cruciale pour
> combiner et réutiliser les quelques ressources et outils qui pourraient
> être disponibles.
>
> L'objectif de ce numéro de Traitement Automatique des Langues (TAL) est
> de donner un aperçu de la recherche actuelle sur le TAL pour les langues
> sous-dotées du monde entier, englobant une grande variété de tâches.
>
> Les auteurs sont invités à soumettre des documents originaux sur tous
> les aspects du TAL pour les langues sous-dotées, en particulier en ce
> qui concerne, mais sans s'y limiter, les questions et tâches suivantes :
>
> - Méthodes d'acquisition et de collecte de ressources et d'annotations
> (p. ex. OCR, crowdsourcing, etc.) pour les données orales et écrites
> - Normalisation orthographique et modèles basés sur les caractères pour
> gérer la variation orthographique
> - Projection d'annotations à partir de langues proches et modèles
> multilingues
> - Méthodes pour traiter le manque de données, les problèmes de qualité
> et les mots hors-vocabulaire
> - Identification de la langue et des variétés, en particulier pour les
> textes courts et les textes en plusieurs langues avec alternance codique
> - Apprentissage des langues assisté par ordinateur et outils d'aide à
> l'écriture (correction orthographique, clavier prédictif et complétion
> de mots)
> - Problèmes liés à la réutilisation des outils, techniques et ressources
> du TAL pour des langues autres que celles initialement ciblées, avec un
> intérêt particulier pour l'interopérabilité et la réutilisabilité des
> ressources et des outils
> - Approches informatisées pour la documentation des langues sous-dotées
> et en danger
>
> Nous invitons également les auteurs à fournir une description courte
> mais précise des langues ou des variétés linguistiques étudiées, en
> mettant l'accent à la fois sur leurs caractéristiques linguistiques et
> sociolinguistiques :
>
> - Bref historique, localisation des locuteurs actuels ;
> - Principales propriétés linguistiques (morphologie, syntaxe) et famille
> de langues ;
> - Système d'écriture ;
> - Vitalité, nombre approximatif de locuteurs et contextes d'utilisation.
>
> DATES IMPORTANTES
>
> - Date limite de soumission : 25 mai 2018
> - Notification aux auteurs, première relecture : 16 juillet 2018
> - Notification aux auteurs, seconde relecture : 30 septembre 2018
> - Version finale : 30 novembre 2018
> - Publication : janvier 2019
>
> LA REVUE
>
> La revue TAL (Traitement Automatique des Langues) est une revue
> internationale éditée depuis 1960 par l’ATALA (Association pour le
> Traitement Automatique des Langues) avec le concours du CNRS. Elle est
> maintenant publiée en format électronique, avec accès gratuit immédiat
> aux articles publiés, et impression annuelle à la demande. Cela ne
> change aucunement son processus de relecture et de sélection.
>
> LANGUE
>
> Les articles sont écrits en français ou en anglais. Les soumissions en
> anglais ne sont acceptées qu'en cas de présence d'au moins un auteur non
> francophone.
>
> FORMAT DE LA SOUMISSION
>
> Les articles doivent faire entre 20 et 25 pages. Les auteurs doivent
> contacter les rédacteurs pour obtenir une dérogation sur la longueur.
>
> Les chercheurs ayant l’intention de soumettre une contribution sont
> invités à déposer leur article en cliquant sur le menu "Soumission d’un
> article" (format PDF). Pour cela, si ce n’est déjà fait, s’inscrire sur
> le site http://www.sciencesconf.org (en haut à gauche, "créer un
> compte"), puis revenir sur la page http://tal-59-3.sciencesconf.org/, se
> connecter et effectuer le dépôt.
>
> La revue TAL a un processus de relecture en double-aveugle. Merci
> d’anonymiser votre article et le nom du fichier.
>
> Les feuilles de style sont disponibles en ligne sur le site de la revue
> : http://old.atala.org/Instructions-aux-auteurs-feuilles
------------------------
Laurent Besacier
Professeur à l'Univ. Grenoble Alpes (UGA)
Laboratoire d'Informatique de Grenoble (LIG)
Membre Junior de l'Institut Universitaire de France (IUF 2012-2017)
laurent.besacier(a)imag.fr
Responsable équipe GETALP du LIG
Directeur de l'école doctorale (ED) MSTII
-------------------------
!! Nouvelles coordonnées !!: LIG
Laboratoire d'Informatique de Grenoble
Bâtiment IMAG
700 avenue Centrale
Domaine Universitaire - 38401 St Martin d'Hères
Pour tout contact concernant ED MSTII: passer par ed-mstii(a)univ-grenoble-alpes.fr <mailto:ed-mstii@univ-grenoble-alpes.fr>
Nouveau tel: 0457421454
--------------------------
> Dear all,
>
> The 6th international workshop on spoken language technologies for under-resourced languages (SLTU'18) will be held in Gurugram, India on 29-31 August 2018
>
> The workshop on spoken language technologies for under- resourced languages is the sixth in a series of even-year SLTU workshops. Five previous workshops were successfully organized: SLTU'16 in Yogyakarta (Indonesia), SLTU'14 in St. Petersburg (Russia), SLTU'12 in Cape Town (South Africa), SLTU'10 in Penang (Malaysia) and SLTU'08 in Hanoi (Vietnam).
>
> There are more than 6000 languages in the world and only few are well represented digitally. India alone, with a country of 780 spoken languages and 86 different scripts that reflect its incredible diversity, has lost around 250 languages in the last 50 years and many more are at the verge of getting extinct. A major focus of this workshop is on Indo-European and Sino-Tibetan languages, but study on other under resourced languages are also encouraged. The workshop is being planned as a satellite workshop to INTERSPEECH 2018 and it is endorsed by SIGUL <http://www.elra.info/en/sig/sigul/> (a joint ISCA-ELRA Special Interest Group on Under-resourced Languages).
>
> Contact: kiit.sltu2018(a)gmail.com <mailto:kiit.sltu2018@gmail.com> Website: http://www.mica.edu.vn/sltu2018 <http://www.mica.edu.vn/sltu2018>
>
> Prospective authors are invited to submit full-length papers up to 4 pages for technical content (including figures, tables, etc) plus one additional page containing only references before June 15th (submission page with paper templates will be updated soon)
>
> NEW INFORMATION
> -Tutorials: 2 tutorials on ASR and NMT will be given - see http://www.mica.edu.vn/sltu2018/index.php?pid=23 <http://www.mica.edu.vn/sltu2018/index.php?pid=23>
> -Keynotes: 2 keynotes speeches will be given by Pushpak Bhattacharyya (IITP) and Emmanuel Dupoux (EHESS) - see http://www.mica.edu.vn/sltu2018/index.php?pid=l5 <http://www.mica.edu.vn/sltu2018/index.php?pid=l5>
>
> Areas/Topics
> q Language resource development, acquisition and representation
> q Linguistic theories, Corpus Development and Resources
> q Linguistic and cognitive studies
> q Unsupervised discovery of linguistic units
> q Code switched lexical modelling
> q Multi-lingual and cross-lingual spoken language processing
> q Speech-to-text, text-to-speech and speech-to-speech processing
> q Machine translation and dialogue systems
> q Application of spoken language technologies for under-resourced languages.
>
> Important Dates
> q Full Paper Submission: 15th June, 2018
> q Acceptance Notification: 10th July, 2018
> q Camera Ready Papers: 17th July, 2018
> q Early Registration: 24th July, 2018
> q Workshop Dates: 29-31st August, 2018
>
>
> ------------------------
> Laurent Besacier
> Professeur à l'Univ. Grenoble Alpes (UGA)
> Laboratoire d'Informatique de Grenoble (LIG)
> Membre Junior de l'Institut Universitaire de France (IUF 2012-2017)
> laurent.besacier(a)imag.fr <mailto:laurent.besacier@imag.fr>
> Responsable équipe GETALP du LIG
> Directeur de l'école doctorale (ED) MSTII
> -------------------------
> !! Nouvelles coordonnées !!: LIG
> Laboratoire d'Informatique de Grenoble
> Bâtiment IMAG
> 700 avenue Centrale
> Domaine Universitaire - 38401 St Martin d'Hères
> Pour tout contact concernant ED MSTII: passer par ed-mstii(a)univ-grenoble-alpes.fr <mailto:ed-mstii@univ-grenoble-alpes.fr>
> Nouveau tel: 0457421454
> --------------------------
FYI
Claudia
(Apologies for cross-posting)
6th International Conference on Language Documentation & Conservation:
Connecting Communities, Languages & Technology
February 28-March 3, 2019
Hawai‘i Imin International Conference Center
Honolulu, Hawai‘i USA
http://icldc6.icldc-hawaii.org <http://icldc6.icldc-hawaii.org/>
Over the past two decades endangered language documentation and
conservation has (re)emerged as a distinct subfield of linguistics with
its own methodology and theoretical underpinnings. This reemergence has
occurred in parallel with a dramatic technological evolution which has
put advanced computing tools in the hands of language documenters and
those striving to reclaim and maintain endangered languages. Moreover,
technology is also changing traditional user roles, blurring the lines
between linguist, speaker, and activist by providing increased access to
information. Digital tools have the power to greatly accelerate the
language work, but the digital realm also brings new challenges for
endangered languages, which sometimes struggle to thrive in a
digitally-mediated world.
At ICLDC 2019 we propose to initiate a dialogue which will lead to
improved connections between communities, languages, and technologies.
We specifically aim to bring together three groups which have not always
worked closely together, namely: linguists, language communities, and
technology developers.
The conference program will feature Keynote talks, Talk Story and
Workshop sessions, papers, and posters. New for 2019 is the Technology
Showcase, a networking opportunity which will bring together technology
developers and language community members. An optional Hilo Field Study
(on the Big Island of Hawaiʻi) to visit Hawaiian language revitalization
programs in action will take place immediately after the conference
(March 4-5). The 3rd Workshop on Computational Methods for Endangered
Languages (ComputEL-3) will take place in Honolulu immediately preceding
the conference (February 26-27).
We have two separate Calls for Proposals, which are now officially open:
* Workshops and Talk Story sessions
<https://icldc6.weebly.com/cfp-workshops.html>(https://icldc6.weebly.com/cfp-workshops.html)*-
deadline June 30, 2018*
*
General sessions (Papers, Posters, Technology Showcase
<https://icldc6.weebly.com/cfp-general.html>(https://icldc6.weebly.com/cfp-general.html)
- *deadline August 31, 2018*
For details about each Call for Proposals type and its requirements and
timelines, please see the Call for Proposals section
<https://icldc6.weebly.com/call-for-proposals.html>(https://icldc6.weebly.com/call-for-proposals.html)
of our conference website. We look forward to your submissions and
participation at the conference!
FYI.
Claudia
-------- Messaggio Inoltrato --------
Oggetto: [SIGLEX] ACL 2018 Workshop on Deep Learning Approaches for
Low-Resource Natural Language Processing (DeepLo)
Data: Fri, 6 Apr 2018 12:56:07 +0000 (UTC)
Mittente: Bahar Salehi <baharsalehi(a)gmail.com>
A: Claudia Soria <claudia.soria(a)ilc.cnr.it>
The 1st Workshop on Deep Learning Approaches for Low-
Resource Natural Language Processing (DeepLo) Workshop at
the Annual Conference of the Association for Computational
Linguistics (ACL), Melbourne, Australia
https://sites.google.com/view/deeplo18/home
WORKSHOP DESCRIPTION
Natural Language Processing is being revolutionized by deep
learning with neural networks. However, deep learning
requires large amounts of annotated data, and its advantage
over traditional statistical methods typically diminishes
when such data is not available; for example, SMT
continues to outperform NMT in many bilingually resource-
poor scenarios. Large amounts of annotated data do not
exist for for many low-resource languages, and for high-
resource languages it can be difficult to find
linguistically annotated data of sufficient size and
quality to allow neural methods to excel.
This workshop aims to bring together researchers from the
NLP and ML communities who work on learning with neural
methods when there is not enough data for those methods to
succeed out-of-the-box.
WORKSHOP TOPICS
Transfer learning
Multi-task learning
Semi-supervised learning
Dual learning
Unsupervised learning
Active learning
Generative adversarial networks
Bandit learning
Domain adaptation
Decipherment or zero-shot learning
Language projections
Universal representations and interlinguas
Low resource structured prediction
IMPORTANT DATES
All submission deadlines are at 11:59 p.m. Anywhere on
Earth (UTC-12)
Paper submission: April 8, 2018 (extended deadline)
Notification of acceptance: May 7, 2018
Camera-ready submission: May 28, 2018
Workshop date: July 19, 2018
SUBMISSION
Submissions consist of up to eight pages of content; there
is no limit on the number of pages for references. Authors
can also submit extended abstracts of up to eight pages of
content. Extended abstracts will not be included in the
proceedings. Thus, your work will retain the status of
being unpublished and later submission at another venue
(e.g., a journal) is not precluded. Likewise, you are free
to re-present work that has been previously published
elsewhere. We anticipate most papers and extended abstracts
to be presented a posters, with only a few selected for
oral presentation.
Please submit your paper using START:
https://www.softconf.com/acl2018/DLNLPLR/
ORGANIZERS
Gholamreza Haffari, Monash University
Colin Cherry, Google Research
George Foster, Google Research
Shahram Khadivi, eBay Research
Bahar Salehi, Melbourne University
=====================================================================
SIGLEX Special Interest Group on the Lexicon SIGLEX
Homepage: siglex.org Webmaster: preslav.nakov(a)gmail.com
SIGLEX Message Center: alt.qcri.org/siglex/messctr.php
=====================================================================
Second Call for Papers, Special Issue of the TAL Journal on "NLP for
Under-Resourced Languages"
Appel à contributions, numéro spécial de la revue TAL "Traitement
automatique des langues peu dotées"
tal-59-3.sciencesconf.org
(see French version below)
NLP for Under-Resourced Languages
Until recently, most of the research work in Natural Language Processing
(NLP) has been focused on a few well-described languages with many
speakers. The lack of interest for other "under-resourced" languages and
language varieties can be accounted for by a variety of reasons: lack of
funding, of human resources, of appropriate technology, of complete and
precise linguistic descriptions, of academic recognition by the
scientific community, etc. Under-resourced languages nevertheless pose
important scientific challenges, which open avenues of progress for NLP
in general. First, at a time when state-of-the-art methods usually
require large amounts of annotated data, work on under-resourced
languages often imposes methods able to deal with small-sized datasets
(small data). Second, given the difficulty of finding resources such as
lexicons or corpora, the collected datasets are often very heterogeneous
with respect to the time, space or domain parameters, e.g. corpora of
texts corresponding to different geolinguistic varieties and different
topics at different time points. This also often involves dealing with
variation in the writing, due either to an evolution of spelling
standards in time or also to the lack of spelling standards for
languages or language varieties which are mostly oral and only seldom
written. Third, NLP for under-resourced languages tends to be carried
out in isolated or sparse research groups, and the resulting products
are often in different formats and standards. Discovering, accessing,
and making those resources interoperable so that they can be reused can
become a challenge in itself. When dealing with under-resourced
languages, issues of interoperability of data and metadata become of
crucial importance for combining and re-using the few resources and
tools that might be available.
The goal of this issue of Traitement Automatique des Langues (TAL) is to
give an overview of current research on NLP for under-resourced
languages from all over the world, encompassing a large variety of tasks.
Authors are invited to submit original papers on all aspects of NLP for
under-resourced languages, in particular regarding, but not limited to,
the following issues and tasks:
- Methods for the acquisition, collection and elicitation of resources
and annotations (e.g., OCR, crowdsourcing, etc.), for textual or spoken
data
- Spelling normalisation and character-level models for spelling variation
- Projection of annotations from closely-related languages and
cross-lingual models
- Methods to deal with data sparsity, low quality issues and
out-of-vocabulary words
- Language and language variety identification, in particular for short
texts and mixed language texts with code-switching
- Computer-assisted language learning and writing aids (spelling
correction, predictive text and word completion)
- Issues related to reusability of NLP tools, techniques and resources
for languages other than those originally targeted, with special concern
for interoperability and reusability of resources and tools
- Computational approaches for under-resourced and endangered languages
documentation
We also invite authors to provide a short but accurate description of
the languages or language varieties under study, focusing both on their
linguistic and sociolinguistic characteristics:
- Brief history, location of current speakers ;
- Main linguistic properties (morphology, syntax) and language family ;
- Writing system ;
- Vitality, approximate number of speakers, and contexts of use.
IMPORTANT DATES
- Submission deadline : May 15, 2018
- Notification to authors after the first review: July 16, 2018
- Notification to authors after the second review: September 30, 2018
- Final version: November 30, 2018
- Publication: January 2019
THE JOURNAL
TAL (Traitement Automatique des Langues / Natural Language Processing)
is an international journal published by ATALA (French Association for
Natural Language Processing, http://www.atala.org) since 1960 with the
support of CNRS. It is now published online, with an immediate open
access to published papers, and annual print on demand. This does not
change its editorial and reviewing process.
LANGUAGE
Manuscripts may be submitted in English or French. French-speaking
authors are requested to submit their contributions in French.
SUBMISSION FORMAT
Papers must be between 20 and 25 pages. Authors should contact the
editors for a derogation on the length.
Authors who intend to submit a paper are encouraged to upload their
contribution via the menu "Paper submission" (PDF format). To do so,
they will need to have an account on the sciencesconf platform. To
create an account, go to the site http://www.sciencesconf.org and click
on "create account" next to the "Connect" button at the top of the page.
To submit, come back to the page http://tal-59-3.sciencesconf.org/,
connect to your account and upload your submission.
From now on, TAL will perform double-blind review: it is thus necessary
to anonymise the manuscript and the name of the pdf file.
Style sheets are available for download on the Web site of the journal:
http://old.atala.org/English-style-files
************************************************************************
French Version
************************************************************************
Jusqu'à récemment, la plupart des travaux de recherche en Traitement
Automatique des Langues (TAL) se sont concentrés sur quelques langues
bien décrites et ayant de nombreux locuteurs. Le manque d'intérêt pour
d'autres langues et variétés linguistiques «sous-dotées» peut
s'expliquer par différentes raisons : manque de financement, de
ressources humaines, de technologie appropriée, de descriptions
linguistiques complètes et précises, de reconnaissance académique par la
communauté scientifique, etc. Les langues sous-dotées posent néanmoins
d'importants défis scientifiques qui ouvrent des pistes de progrès pour
le TAL en général. Premièrement, à une époque où les méthodes de l'état
de l'art nécessitent généralement de grandes quantités de données
annotées, le travail sur des langues sous-dotées impose souvent des
méthodes capables de traiter des jeux de données de petite taille (small
data). Deuxièmement, compte tenu des difficultés à trouver des
ressources telles que des lexiques ou des corpus, les données collectées
sont souvent très hétérogènes et correspondent à différentes époques,
aires linguistiques ou domaines, par exemple des corpus de textes
intégrant différentes variétés géolinguistiques et portant sur
différents sujets à différentes époques. Cette hétérogénéité implique
aussi souvent des variations dans la graphie, dues soit à une évolution
des normes orthographiques dans le temps, soit à l'absence de normes
orthographiques pour les langues ou les variétés linguistiques qui sont
essentiellement orales et rarement écrites. Troisièmement, les travaux
de TAL pour les langues sous-dotées ont tendance à être réalisés dans
des groupes de recherche isolés ou dispersés, et les ressources
produites utilisent souvent des formats et des normes différents.
Trouver ces ressources, y accéder et les rendre interopérables pour
qu'elles puissent être réutilisées peut devenir un défi en soi. Quand il
s'agit de langues sous-dotées, les questions d'interopérabilité des
données et des métadonnées deviennent d'une importance cruciale pour
combiner et réutiliser les quelques ressources et outils qui pourraient
être disponibles.
L'objectif de ce numéro de Traitement Automatique des Langues (TAL) est
de donner un aperçu de la recherche actuelle sur le TAL pour les langues
sous-dotées du monde entier, englobant une grande variété de tâches.
Les auteurs sont invités à soumettre des documents originaux sur tous
les aspects du TAL pour les langues sous-dotées, en particulier en ce
qui concerne, mais sans s'y limiter, les questions et tâches suivantes :
- Méthodes d'acquisition et de collecte de ressources et d'annotations
(p. ex. OCR, crowdsourcing, etc.) pour les données orales et écrites
- Normalisation orthographique et modèles basés sur les caractères pour
gérer la variation orthographique
- Projection d'annotations à partir de langues proches et modèles
multilingues
- Méthodes pour traiter le manque de données, les problèmes de qualité
et les mots hors-vocabulaire
- Identification de la langue et des variétés, en particulier pour les
textes courts et les textes en plusieurs langues avec alternance codique
- Apprentissage des langues assisté par ordinateur et outils d'aide à
l'écriture (correction orthographique, clavier prédictif et complétion
de mots)
- Problèmes liés à la réutilisation des outils, techniques et ressources
du TAL pour des langues autres que celles initialement ciblées, avec un
intérêt particulier pour l'interopérabilité et la réutilisabilité des
ressources et des outils
- Approches informatisées pour la documentation des langues sous-dotées
et en danger
Nous invitons également les auteurs à fournir une description courte
mais précise des langues ou des variétés linguistiques étudiées, en
mettant l'accent à la fois sur leurs caractéristiques linguistiques et
sociolinguistiques :
- Bref historique, localisation des locuteurs actuels ;
- Principales propriétés linguistiques (morphologie, syntaxe) et famille
de langues ;
- Système d'écriture ;
- Vitalité, nombre approximatif de locuteurs et contextes d'utilisation.
DATES IMPORTANTES
- Date limite de soumission : 15 mai 2018
- Notification aux auteurs, première relecture : 16 juillet 2018
- Notification aux auteurs, seconde relecture : 30 septembre 2018
- Version finale : 30 novembre 2018
- Publication : janvier 2019
LA REVUE
La revue TAL (Traitement Automatique des Langues) est une revue
internationale éditée depuis 1960 par l’ATALA (Association pour le
Traitement Automatique des Langues) avec le concours du CNRS. Elle est
maintenant publiée en format électronique, avec accès gratuit immédiat
aux articles publiés, et impression annuelle à la demande. Cela ne
change aucunement son processus de relecture et de sélection.
LANGUE
Les articles sont écrits en français ou en anglais. Les soumissions en
anglais ne sont acceptées qu'en cas de présence d'au moins un auteur non
francophone.
FORMAT DE LA SOUMISSION
Les articles doivent faire entre 20 et 25 pages. Les auteurs doivent
contacter les rédacteurs pour obtenir une dérogation sur la longueur.
Les chercheurs ayant l’intention de soumettre une contribution sont
invités à déposer leur article en cliquant sur le menu "Soumission d’un
article" (format PDF). Pour cela, si ce n’est déjà fait, s’inscrire sur
le site http://www.sciencesconf.org (en haut à gauche, "créer un
compte"), puis revenir sur la page http://tal-59-3.sciencesconf.org/, se
connecter et effectuer le dépôt.
La revue TAL a un processus de relecture en double-aveugle. Merci
d’anonymiser votre article et le nom du fichier.
Les feuilles de style sont disponibles en ligne sur le site de la revue
: http://old.atala.org/Instructions-aux-auteurs-feuilles
--
Claudia Soria
Researcher
Istituto di Linguistica Computazionale "A. Zampolli"
Consiglio Nazionale delle Ricerche
Via Moruzzi 1
56124 Pisa
Italy
Tel. +39 050 3153166
Skype clausor
--
Claudia Soria
Researcher
Istituto di Linguistica Computazionale "A. Zampolli"
Consiglio Nazionale delle Ricerche
Via Moruzzi 1
56124 Pisa
Italy
Tel. +39 050 3153166
Skype clausor
Call for papers, special issue of the TAL journal on "NLP for
Under-Resourced Languages"
Appel à contributions, numéro spécial de la revue TAL "Traitement
automatique des langues peu dotées"
tal-59-3.sciencesconf.org
(see French version below)
NLP for Under-Resourced Languages
Until recently, most of the research work in Natural Language Processing
(NLP) has been focused on a few well-described languages with many
speakers. The lack of interest for other "under-resourced" languages and
language varieties can be accounted for by a variety of reasons: lack of
funding, of human resources, of appropriate technology, of complete and
precise linguistic descriptions, of academic recognition by the
scientific community, etc. Under-resourced languages nevertheless pose
important scientific challenges, which open avenues of progress for NLP
in general. First, at a time when state-of-the-art methods usually
require large amounts of annotated data, work on under-resourced
languages often imposes methods able to deal with small-sized datasets
(small data). Second, given the difficulty of finding resources such as
lexicons or corpora, the collected datasets are often very heterogeneous
with respect to the time, space or domain parameters, e.g. corpora of
texts corresponding to different geolinguistic varieties and different
topics at different time points. This also often involves dealing with
variation in the writing, due either to an evolution of spelling
standards in time or also to the lack of spelling standards for
languages or language varieties which are mostly oral and only seldom
written. Third, NLP for under-resourced languages tends to be carried
out in isolated or sparse research groups, and the resulting products
are often in different formats and standards. Discovering, accessing,
and making those resources interoperable so that they can be reused can
become a challenge in itself. When dealing with under-resourced
languages, issues of interoperability of data and metadata become of
crucial importance for combining and re-using the few resources and
tools that might be available.
The goal of this issue of Traitement Automatique des Langues (TAL) is to
give an overview of current research on NLP for under-resourced
languages from all over the world, encompassing a large variety of tasks.
Authors are invited to submit original papers on all aspects of NLP for
under-resourced languages, in particular regarding, but not limited to,
the following issues and tasks:
- Methods for the acquisition, collection and elicitation of resources
and annotations (e.g., OCR, crowdsourcing, etc.), for textual or spoken
data
- Spelling normalisation and character-level models for spelling variation
- Projection of annotations from closely-related languages and
cross-lingual models
- Methods to deal with data sparsity, low quality issues and
out-of-vocabulary words
- Language and language variety identification, in particular for short
texts and mixed language texts with code-switching
- Computer-assisted language learning and writing aids (spelling
correction, predictive text and word completion)
- Issues related to reusability of NLP tools, techniques and resources
for languages other than those originally targeted, with special concern
for interoperability and reusability of resources and tools
- Computational approaches for under-resourced and endangered languages
documentation
We also invite authors to provide a short but accurate description of
the languages or language varieties under study, focusing both on their
linguistic and sociolinguistic characteristics:
- Brief history, location of current speakers ;
- Main linguistic properties (morphology, syntax) and language family ;
- Writing system ;
- Vitality, approximate number of speakers, and contexts of use.
IMPORTANT DATES
- Submission deadline : May 15, 2018
- Notification to authors after the first review: July 16, 2018
- Notification to authors after the second review: September 30, 2018
- Final version: November 30, 2018
- Publication: January 2019
THE JOURNAL
TAL (Traitement Automatique des Langues / Natural Language Processing)
is an international journal published by ATALA (French Association for
Natural Language Processing, http://www.atala.org) since 1960 with the
support of CNRS. It is now published online, with an immediate open
access to published papers, and annual print on demand. This does not
change its editorial and reviewing process.
LANGUAGE
Manuscripts may be submitted in English or French. French-speaking
authors are requested to submit their contributions in French.
SUBMISSION FORMAT
Papers must be between 20 and 25 pages. Authors should contact the
editors for a derogation on the length.
Authors who intend to submit a paper are encouraged to upload their
contribution via the menu "Paper submission" (PDF format). To do so,
they will need to have an account on the sciencesconf platform. To
create an account, go to the site http://www.sciencesconf.org and click
on "create account" next to the "Connect" button at the top of the page.
To submit, come back to the page http://tal-59-3.sciencesconf.org/,
connect to your account and upload your submission.
From now on, TAL will perform double-blind review: it is thus necessary
to anonymise the manuscript and the name of the pdf file.
Style sheets are available for download on the Web site of the journal:
http://www.atala.org/content/instruction-authors-style-files-0
************************************************************************
French Version
************************************************************************
Jusqu'à récemment, la plupart des travaux de recherche en Traitement
Automatique des Langues (TAL) se sont concentrés sur quelques langues
bien décrites et ayant de nombreux locuteurs. Le manque d'intérêt pour
d'autres langues et variétés linguistiques «sous-dotées» peut
s'expliquer par différentes raisons : manque de financement, de
ressources humaines, de technologie appropriée, de descriptions
linguistiques complètes et précises, de reconnaissance académique par la
communauté scientifique, etc. Les langues sous-dotées posent néanmoins
d'importants défis scientifiques qui ouvrent des pistes de progrès pour
le TAL en général. Premièrement, à une époque où les méthodes de l'état
de l'art nécessitent généralement de grandes quantités de données
annotées, le travail sur des langues sous-dotées impose souvent des
méthodes capables de traiter des jeux de données de petite taille (small
data). Deuxièmement, compte tenu des difficultés à trouver des
ressources telles que des lexiques ou des corpus, les données collectées
sont souvent très hétérogènes et correspondent à différentes époques,
aires linguistiques ou domaines, par exemple des corpus de textes
intégrant différentes variétés géolinguistiques et portant sur
différents sujets à différentes époques. Cette hétérogénéité implique
aussi souvent des variations dans la graphie, dues soit à une évolution
des normes orthographiques dans le temps, soit à l'absence de normes
orthographiques pour les langues ou les variétés linguistiques qui sont
essentiellement orales et rarement écrites. Troisièmement, les travaux
de TAL pour les langues sous-dotées ont tendance à être réalisés dans
des groupes de recherche isolés ou dispersés, et les ressources
produites utilisent souvent des formats et des normes différents.
Trouver ces ressources, y accéder et les rendre interopérables pour
qu'elles puissent être réutilisées peut devenir un défi en soi. Quand il
s'agit de langues sous-dotées, les questions d'interopérabilité des
données et des métadonnées deviennent d'une importance cruciale pour
combiner et réutiliser les quelques ressources et outils qui pourraient
être disponibles.
L'objectif de ce numéro de Traitement Automatique des Langues (TAL) est
de donner un aperçu de la recherche actuelle sur le TAL pour les langues
sous-dotées du monde entier, englobant une grande variété de tâches.
Les auteurs sont invités à soumettre des documents originaux sur tous
les aspects du TAL pour les langues sous-dotées, en particulier en ce
qui concerne, mais sans s'y limiter, les questions et tâches suivantes :
- Méthodes d'acquisition et de collecte de ressources et d'annotations
(p. ex. OCR, crowdsourcing, etc.) pour les données orales et écrites
- Normalisation orthographique et modèles basés sur les caractères pour
gérer la variation orthographique
- Projection d'annotations à partir de langues proches et modèles
multilingues
- Méthodes pour traiter le manque de données, les problèmes de qualité
et les mots hors-vocabulaire
- Identification de la langue et des variétés, en particulier pour les
textes courts et les textes en plusieurs langues avec alternance codique
- Apprentissage des langues assisté par ordinateur et outils d'aide à
l'écriture (correction orthographique, clavier prédictif et complétion
de mots)
- Problèmes liés à la réutilisation des outils, techniques et ressources
du TAL pour des langues autres que celles initialement ciblées, avec un
intérêt particulier pour l'interopérabilité et la réutilisabilité des
ressources et des outils
- Approches informatisées pour la documentation des langues sous-dotées
et en danger
Nous invitons également les auteurs à fournir une description courte
mais précise des langues ou des variétés linguistiques étudiées, en
mettant l'accent à la fois sur leurs caractéristiques linguistiques et
sociolinguistiques :
- Bref historique, localisation des locuteurs actuels ;
- Principales propriétés linguistiques (morphologie, syntaxe) et famille
de langues ;
- Système d'écriture ;
- Vitalité, nombre approximatif de locuteurs et contextes d'utilisation.
DATES IMPORTANTES
- Date limite de soumission : 15 mai 2018
- Notification aux auteurs, première relecture : 16 juillet 2018
- Notification aux auteurs, seconde relecture : 30 septembre 2018
- Version finale : 30 novembre 2018
- Publication : janvier 2019
LA REVUE
La revue TAL (Traitement Automatique des Langues) est une revue
internationale éditée depuis 1960 par l’ATALA (Association pour le
Traitement Automatique des Langues) avec le concours du CNRS. Elle est
maintenant publiée en format électronique, avec accès gratuit immédiat
aux articles publiés, et impression annuelle à la demande. Cela ne
change aucunement son processus de relecture et de sélection.
LANGUE
Les articles sont écrits en français ou en anglais. Les soumissions en
anglais ne sont acceptées qu'en cas de présence d'au moins un auteur non
francophone.
FORMAT DE LA SOUMISSION
Les articles doivent faire entre 20 et 25 pages. Les auteurs doivent
contacter les rédacteurs pour obtenir une dérogation sur la longueur.
Les chercheurs ayant l’intention de soumettre une contribution sont
invités à déposer leur article en cliquant sur le menu "Soumission d’un
article" (format PDF). Pour cela, si ce n’est déjà fait, s’inscrire sur
le site http://www.sciencesconf.org (en haut à gauche, "créer un
compte"), puis revenir sur la page http://tal-59-3.sciencesconf.org/, se
connecter et effectuer le dépôt.
La revue TAL a un processus de relecture en double-aveugle. Merci
d’anonymiser votre article et le nom du fichier.
Les feuilles de style sont disponibles en ligne sur le site de la revue
: http://www.atala.org/content/instructions-aux-auteurs-feuilles-de-style-0
--
Claudia Soria
Researcher
Istituto di Linguistica Computazionale "A. Zampolli"
Consiglio Nazionale delle Ricerche
Via Moruzzi 1
56124 Pisa
Italy
Tel. +39 050 3153166
Skype clausor
FYI
-------- Messaggio Inoltrato --------
Oggetto: [ln] Appel: Fifth Workshop on NLP for Similar Languages,
Varieties and Dialects (VarDial)
Data: Tue, 23 Jan 2018 20:35:50 +0100
Mittente: Thierry Hamon <hamon(a)limsi.fr>
Rispondi-a: ln(a)cines.fr, Thierry Hamon <hamon(a)limsi.fr>
A: ln(a)cines.fr
Date: Thu, 18 Jan 2018 17:55:54 +0100
From: Marcos Zampieri <marcos.zampieri(a)uni-saarland.de>
Message-ID: <20180118175554.Horde.DIufy7dRlvLTiVghhIOsCY9(a)webmail.uni-saarland.de>
X-url: http://alt.qcri.org/vardial2018/
X-url: http://alt.qcri.org/vardial2018/index.php?id=campaign
Call for Papers
VarDial - Fifth Workshop on NLP for Similar Languages, Varieties and
Dialects
VarDial 2018: http://alt.qcri.org/vardial2018/
Co-located with COLING 2018, in VarDial we anticipate discussion on
computational methods and on language resources for closely related
languages, language varieties and dialects. Corpus-driven studies on
different degrees of linguistic variation such as lexicon and grammar is
another topic of interest.
Together with the VarDial workshop we are organizing the second edition
of the VarDial Evaluation Campaign with five shared tasks
(http://alt.qcri.org/vardial2018/index.php?id=campaign). Registration is
now open and the training data will be released in March.
Topics
We welcome papers dealing with one or more of the following topics:
- Language resources and tools for similar languages, varieties and
dialects;
- Adaptation of tools (taggers, parsers) for similar languages,
varieties and dialects;
- Evaluation of language resources and tools when applied to language
varieties;
- Reusability of language resources in NLP applications (e.g., for
machine translation, POS tagging, syntactic parsing, etc.);
- Corpus-driven studies in dialectology and language variation;
- Computational approaches to the study of mutual intelligibility
between dialects and similar languages;
- Automatic identification of lexical variation;
- Automatic classification of language varieties;
- Text similarity and adaptation between language varieties;
- Linguistic issues in the adaptation of language resources and tools
(e.g., semantic discrepancies, lexical gaps, false friends);
- Machine translation between closely related languages, language
varieties and dialects.
Instruction for Authors
Submissions should be formatted according to the COLING template and
submitted in PDF format. The review process will be double-blind.
Important Dates
Submission Deadline: May 18, 2018
Acceptance Notification: June 20, 2018
Camera-ready versions: June 30, 2018
Workshop: August 20 or 21, 2018
Program Committee
Željko Agić (IT University of Copenhagen, Denmark)
Cesar Aguilar (Pontifical Catholic University of Chile, Chile)
Laura Alonso y Alemany (University of Cordoba, Argentina)
Jorge Baptista (University of Algarve and INESC-ID, Portugal)
Eckhard Bick (University of Southern Denmark, Denmark)
Johannes Bjerva (University of Copenhagen, Denmark)
Francis Bond (Nanyang Technological University, Singapore)
Aoife Cahill (Educational Testing Service, United States)
David Chiang (University of Notre Dame, United States)
Paul Cook (University of New Brunswick, Canada)
Marta Costa-Jussà (Universitat Politècnica de Catalunya, Spain)
Jon Dehdari (Think Big Analytics, United States)
Liviu Dinu (University of Bucharest, Romania)
Stefanie Dipper (Ruhr University Bochum, Germany)
Sascha Diwersy (University of Montpellier, France)
Mark Dras (Macquire University, Australia)
Tomaž Erjavec (Jožef Stefan Institute, Slovenia)
Mikel L. Forcada (Universitat d'Alacant, Spain)
Binyam Gebrekidan Gebre (Phillips Research, The Netherlands)
Cyril Goutte (National Research Council, Canada)
Nizar Habash (New York University Abu Dhabi, UAE)
Chu-Ren Huang (Hong Kong Polytechnic University, Hong Kong)
Jeremy Jancsary (Nuance Communications, Austria)
Lung-Hao Lee (National Taiwan Normal University, Taiwan)
Marco Lui (Rome2Rio Ltd., Australia)
Teresa Lynn (Dublin City University, Ireland)
John Nerbonne (University of Groningen, Netherlands and University of Freiburg, Germany)
Kemal Oflazer (Carnegie-Mellon University in Qatar, Qatar)
Maciej Ogrodniczuk (IPAN, Polish Academy of Sciences, Poland)
Petya Osenova (Bulgarian Academy of Sciences, Bulgaria)
Santanu Pal (Saarland University, Germany)
Barbara Plank (Unviersity of Groningen, The Netherlands)
Francisco Rangel (Autoritas Consulting, Spain)
Taraka Rama (University of Oslo, Norway)
Reinhard Rapp (University of Mainz, Germany and University of Aix-Marsaille, France)
Paolo Rosso (Technical University of Valencia, Spain)
Fatiha Sadat (Université du Québec à Montréal (UQAM), Canada)
Tanja Samardžić (University of Zurich, Switzerland)
Felipe Sánchez Martínez (Universitat d'Alacant, Spain)
Kevin Scannell (Saint Louis University, United States)
Yves Scherrer (University of Helsinki, Finland)
Serge Sharoff (University of Leeds, United Kingdom)
Kiril Simov (Bulgarian Academy of Sciences, Bulgaria)
Milena Slavcheva (Bulgarian Academy of Sciences, Bulgaria)
Marco Tadić (University of Zagreb, Croatia)
Liling Tan (Rakuten Institute of Technology, Singapore)
Elke Teich (Saarland University, Germany)
Joel Tetreault (Grammarly, United States)
Francis Tyers (Higher School of Economics, Russia)
Duško Vitas (University of Belgrade, Serbia)
Taro Watanabe (Google Inc., Japan)
Pidong Wang (Machine Zone Inc., United States)
Organizers
Preslav Nakov (Qatar Computing Research Institute, HBKU, Qatar)
Marcos Zampieri (University of Wolverhampton, United Kingdom)
Nikola Ljubešić (Jožef Stefan Institute, Slovenia and University of Zagreb, Croatia)
Jörg Tiedemann (University of Helsinki, Finland)
Shervin Malmasi (Harvard Medical School, United States)
Ahmed Ali (Qatar Computing Research Institute, HBKU, Qatar)
Contact
Workshop: vardialworkshop(at)gmail.com
-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN(a)cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version :
Archives : http://listserv.linguistlist.org/archives/ln.htmlhttp://liste.cines.fr/info/ln
La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion : http://www.atala.org/
ATALA décline toute responsabilité concernant le contenu des
messages diffusés sur la liste LN
-------------------------------------------------------------------------
FYI
*** Workshop: Computational Methods for Endangered Language
Documentation and Description ***
http://lattice.cnrs.fr/cmld/index.html
*** The number of seats is limited. Registration is mandatory (see
below). ***
February 1st-2nd, 2018
Ecole Normale Supérieure, 45 rue d’Ulm, 75005 Paris
France
* Organizers:
Thierry Poibeau (Lattice)
Michael Rießler (University of Bielefeld & The Freiburg Research Group
in Saami Studies)
Niko Partanen (Lattice & The Freiburg Research Group in Saami Studies)
Benjamin Fagard (Lattice).
* Overview
This workshop aims at examining the application of specific methods from
Natural Language Processing in order to analyze data from endangered and
low-resource languages from Northern Eurasia and other parts of the
world. The workshop defines language technologies in a very broad sense
and therefore includes also computational methods for signal processing
in general, as such technologies can be applied effectively to the work
with text corpora linked to multimedia data.
Invited speakers include Joakim Nivre (Uppsala), Francis Tyers (Moscow),
Laurent Besacier (Grenoble), Trond Tosterud (Tromsø), Svetlana Toldova
(Moscow), Olga Majewska (Cambridge) and Jargal Badagarov (Ulan-Ude).
The programme is now available online
(http://lattice.cnrs.fr/cmld/program.html) as well as the list of
posters (http://lattice.cnrs.fr/cmld/posters.html). There will be ample
time for discussion, as the workshop is also an opportunity to foster
collaborations.
* Registration
The event is free but it is necessary to register in advance. In order
to register, please send an email with your name and affiliation to:
nikotapiopartanen(a)gmail.com . Participants with talk or poster are
automatically registered, but do not hesitate to contact us if there are
any questions.
Please come with an ID card, passport or other proof of identity
*** The number of seats is limited. Registration is mandatory. ***
* Acknowledgements
This work has received support of TransferS (laboratoire d’excellence,
program “Investissements d’avenir” ANR-10-IDEX-0001-02 PSL* and
ANR-10-LABX-0099).
This workshoop is held in coordination with the CNRS-funded programme
PRC n° 1052 : Analyse systématique du groupe nominal dans les langues
finno-ougriennes : continuité référentielle et codage de la structure
informationnelle de l’énoncé.
> Début du message réexpédié :
>
> De: Claudia Soria <claudia.soria(a)ilc.cnr.it>
> Objet: CCURL 2018 @ LREC 2018: Extended deadline (21/01/2018)
> Date: 12 janvier 2018 10:41:20 UTC+1
> À: "Pretorius, Laurette" <Pretol(a)unisa.ac.za>, Laurent Besacier <laurent.besacier(a)imag.fr>, Tunde Adegbola <taintransit(a)hotmail.com>, Gilles ADDA <gadda(a)limsi.fr>, "dr.shyamsagrawal(a)gmail.com" <dr.shyamsagrawal(a)gmail.com>, Antti Arppe <arppe(a)ualberta.ca>, Victoria Arranz <arranz(a)elda.org>, "Benjamin, Martin" <martin(a)kamusi.org>, Bruce Birch <bruce.birch(a)anu.edu.au>, Steven Bird <stevenbird1(a)gmail.com>, Luong Chi Mai <lcmai(a)ioit.ac.vn>, Khalid CHOUKRI <choukri(a)elda.org>, "Cieri, Christopher M" <ccieri(a)ldc.upenn.edu>, "thierry.declerck(a)dfki.de" <thierry.declerck(a)dfki.de>, Sebastian Drude <sdrude(a)hi.is>, Vera Ferreira <vferreira(a)cidles.eu>, Mikel Forcada <mlf(a)dlsi.ua.es>, Dafydd Gibbon <gibbon(a)uni-bielefeld.de>, Tatjana Gornostaja <tatjana.gornostaja(a)Tilde.lv>, John Judge <john.judge(a)adaptcentre.ie>, Andras Kornai <andras(a)kornai.com>, Joseph Mariani <Joseph.Mariani(a)limsi.fr>, Yohei Murakami <yohei(a)i.kyoto-u.ac.jp>, "s-nakamura(a)is.naist.jp" <s-nakamura(a)is.naist.jp>, Girish Nath Jha <girishjha(a)gmail.com>, Guy De Pauw <guy(a)textgain.com>, Sakriani Sakti <ssakti(a)is.naist.jp>, Kevin Scannell <kscanne(a)gmail.com>, Oliver Stegen <oliver_stegen(a)sil.org>, Tyers Francis Morton <ftyers(a)prompsit.com>, Trosterud Trond <trond.trosterud(a)uit.no>, Kadri Vider <kadri.vider(a)ut.ee>, "Eveline.Wandl-Vogt(a)oeaw.ac.at" <Eveline.Wandl-Vogt(a)oeaw.ac.at>
>
>
>
> [Apologies for multiple postings]
>
> *Submission deadline extended to 21 January 2018*
>
> CCURL 2018
>
> Collaboration and Computing for Under-Resourced Languages
>
> "Sustaining knowledge diversity in the digital age"
>
> a Workshop to be held as part of the 11th edition of the Language Resources and Evaluation Conference (LREC 2018) at the Phoenix Seagaia Resort in Miyazaki (Japan)
>
> 3RD CALL FOR PAPERS
>
> Date: 12 May 2018
> Web site: http://www.ilc.cnr.it/ccurl2018 <http://www.ilc.cnr.it/ccurl2018>
> NEW Submission deadline: 21 January 2018
>
> WORKSHOP DESCRIPTION AND OBJECTIVE
>
> The third CCURL Workshop, entitled "Sustaining knowledge diversity in the digital age", will take place on Saturday, 12 May 2018 in Miyazaki, Japan, in conjunction with LREC 2018. This workshop aims at gathering together academics, industrial researchers, knowledge experts, digital language resource and technology providers, software developers, but also language activists and community representatives in order to identify the current capacity for and the difficulties in creating and sustaining the digital representation of traditional knowledge. The diversity of cultures is a distinctive footprint of the way humans have been coping with the environment over time; unique visions of the world and knowledge are expressed by indigenous languages. Preservation and sharing of the traditional knowledge encoded by languages is being increasingly recognised as a step towards a sustainable and durable interaction of mankind with the environment. However, as language diversity is decreasing, the maintenance and transmission of such knowledge is at risk. Digital language resources can help avoid the disappearance of diverse knowledge systems, ensure their preservation and transmission, and foster their cross-fertilisation. The vast majority of this knowledge is poorly represented in digital form (only four out of the 522 indigenous languages of Latin America are represented by Wikipedia projects, for example). Moreover, as this knowledge is encoded in underresourced (minority, endangered or minoritised) languages, specific methods and models of resource development are required to circumvent the problems affecting low-resourced languages, such as low investments, data sparsity, fragmentation of efforts, speaker communities" lack of involvement, to cite just a few. Specific problems arise as well: low digital literacy, the issue of community ownership and control over content, or the need to include audio and video to accommodate languages that are unwritten or having no orthography standard.
>
> TOPICS OF INTEREST
>
> We solicit papers and posters related to the following non-exclusive topics:
>
> * models and methods for the development of language resources for representing traditional knowledge;
>
> * experiences about forms of collaboration among research, industry and local communities;
>
> * involvement of speakers' communities and ethical issues related to knowledge protection;
>
> * replicability of experiences;
>
> * use of knowledge resources for cultural heritage preservation and education;
>
> * use of video and audio as complementary or alternative ways to writing in order to accommodate languages not spoken or with unstable orthographies;
>
> * innovative data collection and data annotation methodologies;
>
> * semantic and semantic web technologies for representing indigenous knowledge systems in indigenous languages.
>
> SUBMISSION AND PUBLICATION
>
> We accept submission of long papers (up to 8 pages), short papers (up to 4 pages) and poster papers (up to 4 pages) to be presented as a long or short oral presentation at the workshop. The papers of the workshop will be published in online proceedings. Papers are expected to address the workshop main theme. They can contain an analysis and insight into existing methods and problems; a description of resources; an overview of the literature or of the current initiatives, or a combination of the above. Authors must declare if part of the paper contains material previously published elsewhere. Each submission will be reviewed by three programme committee members. In compliance with the LREC rules, papers must not be anonymized. Papers should be formatted according to the stylesheet provided by LREC 2018 (http://lrec2018.lrec-conf.org/en/submission/authors-kit/ <http://lrec2018.lrec-conf.org/en/submission/authors-kit/>) and should not exceed 8 pages, including references and appendices. Papers should be submitted in PDF unprotected format to the workshop START page (URL will be provided in due time). The formatting template must be strictly adhered to and deadlines met.
>
> IMPORTANT DATES
>
> * NEW Paper submission deadline: 21 January 2018
>
> * Notification of acceptance: 14 February 2018
>
> * Camera-ready paper: 7 March 2018
>
> * Workshop date: 12 May 2018
>
> IDENTIFY, DESCRIBE AND SHARE YOUR LRS!
>
> * Describing your LRs in the LRE Map is now a normal practice in the submission procedure of LREC (introduced in 2010 and adopted by other conferences). To continue the efforts initiated at LREC 2014 about "Sharing LRs" (data, tools, web-services, etc.), authors will have the possibility, when submitting a paper, to upload LRs in a special LREC repository. This effort of sharing LRs, linked to the LRE Map for their description, may become a new "regular" feature for conferences in our field, thus contributing to creating a common repository where everyone can deposit and share data.
>
> * As scientific work requires accurate citations of referenced work so as to allow the community to understand the whole context and also replicate the experiments conducted by other researchers, LREC 2018 endorses the need to uniquely Identify LRs through the use of the International Standard Language Resource Number (ISLRN, www.islrn.org <http://www.islrn.org/>), a Persistent Unique Identifier to be assigned to each Language Resource. The assignment of ISLRNs to LRs cited in LREC papers will be offered at submission time.
>
> ORGANISING COMMITTEE
>
> Laurent Besacier, LIG-IMAG, France
> Laurette Pretorius, University of South Africa, South Africa
> Claudia Soria, CNR-ILC, Italy
>
> The Workshop is endorsed by SIGUL, a joint ELRA-ISCA Special Interest Group on Under-resourced Languages (http://www.elra.info/en/sig/sigul/ <http://www.elra.info/en/sig/sigul/>).
>
> PROGRAMME COMMITTEE
>
> Tunde Adegbola, African Languages Technology Initiative, Nigeria
> Gilles Adda, LIMSI/IMMI CNRS, France
> Shyam Agrawal, KIIT Group of Colleges, India
> Amir Aharoni, Wikimedia Foundation
> Antti Arppe, University of Alberta, Canada
> Victoria Arranz, ELRA/ELDA, France
> Martin Benjamin, the Kamusi Project, Switzerland
> Laurent Besacier, LIG-IMAG, France
> Bruce Birch, The Minjilang Endangered Languages Publications Project, Australia
> Steven Bird, Charles Darwin University, Australia
> Luong Chi-Mai, IOIT, Vietnam
> Khalid Choukri, ELRA/ELDA, France
> Chris Cieri, LDC, USA
> Thierry Declerck, DFKI, Germany
> Sebastian Drude, The Vigdis International Centre for Multilingualism and Intercultural
> Understanding, Iceland
> Vera Ferreira, CIDLeS - Interdisciplinary Centre for Social and Language Documentation, Portugal
> Mikel Forcada, Universitat d'Alacant, Spain
> Dafydd Gibbon, Bielefeld University, Germany
> Tatjana Gornostaja, Tilde, Latvia
> John Judge, ADAPT DCU, Ireland
> Andras Kornai, Hungarian Academy of Sciences, Hungary
> Joseph Mariani, LIMSI-CNRS, France
> Yohei Murakami, Kyoto University, Japan
> Satoshi Nakamura, NARA INSTITUTE OF SCIENCE AND TECHNOLOGY, Japan
> Girish Nath Jha, JNU, India
> Guy de Pauw, Textgain, Belgium
> Laurette Pretorius, University of South Africa, South Africa
> Sakriani Sakti, NAIST, Japan
> Kevin Scannell, Saint Louis University, Missouri, USA
> Claudia Soria, CNR-ILC, Italy
> Oliver Stegen, SIL International, USA
> Francis Tyers, Moscow Higher School of Economics, Russia
> Trond Trosterud, Arctic University of Norway
> Kadri Vider, University of Tartu, Estonia
> Eveline Wandl-Vogt, Austrian Academy of Sciences, Austria
>
>
> --
> Claudia Soria
> Researcher
> Istituto di Linguistica Computazionale "A. Zampolli"
> Consiglio Nazionale delle Ricerche
> Via Moruzzi 1
> 56124 Pisa
> Italy
>
> Tel. +39 050 3153166
> Skype clausor
------------------------
Laurent Besacier
Professeur à l'Univ. Grenoble Alpes (UGA)
Laboratoire d'Informatique de Grenoble (LIG)
Membre Junior de l'Institut Universitaire de France (IUF 2012-2017)
laurent.besacier(a)imag.fr
Responsable équipe GETALP du LIG
Directeur de l'école doctorale (ED) MSTII
-------------------------
!! Nouvelles coordonnées !!: LIG
Laboratoire d'Informatique de Grenoble
Bâtiment IMAG
700 avenue Centrale
Domaine Universitaire - 38401 St Martin d'Hères
Pour tout contact concernant ED MSTII: passer par ed-mstii(a)univ-grenoble-alpes.fr <mailto:ed-mstii@univ-grenoble-alpes.fr>
Nouveau tel: 0457421454
--------------------------