Séminaire Papillon 2002


7 16 - 18 juillet



Lieu 場所 venue :

National Institute of Informatics


Hitotsubashi 2-1-2-1412




〒101-8430 TOKYO






概要: (Version française plus bas) (English version below)


より詳細な情報を入手されたい方は、パピヨンウェブサーバ http://www.papillon-dictionary.org を御覧下さい。

マンジョ・マチューにメールを下さい mailto:mangeot@nii.ac.jp

Présentation :

Les bases lexicales multilingues sont des serveurs de données lexicales structurées. Ces données peuvent être utilisées soit par des humains pour définir leur propre dictionnaire soit par des applications de traitement des langues.

Ces dernières années, nous assistons à une accumulation de ressources lexicales dans les laboratoires de traitement automatique de la langue ainsi que sur Internet. les bases lexicales multilingues tentent de résoudre ce problème d'accumulation en organisant la manipulation et l'accès à ces ressources. Ces bases sont un point central de la recherche dans les sciences du langage et dans le développement des technologies de la langue. Comme les bases de données génomiques, les bases lexicales sont complexes, évoluent, constituent des serveur richement annotés et posent de difficiles problèmes scientifiques dans de nombreux domaines.

Les buts de cet atelier sont de rendre compte de la recherche existante dans les bases de données multilingues et d'identifier les problèmes clés. Plus généralement, l'atelier aidera à definir des questions de recherche de la nouvelle "communauté des bases lexicales multilingues" autour de Papillon et initiera les échanges sur les problèmes en cours et les résultats entre cette communauté et les autres communautés (lexicographie, traduction, interfaces hommes-machine, bases de données au sens large, etc.).

Papillon est un projet de construction et d'usage collaboratifs sur la toile d'une base lexicale multilingue et de dictionnaires dérivés en source ouverte (français, anglais, japonais, lao, thai et vietnamien). L'atelier est destiné à des participants de plusieurs specialités incluant les bases de données, la linguistique, la linguistique-informatique, les annotations et XML.

Pour plus d’informations, consultez le serveur du projet à l’adresse suivante : http://www.papillon-dictionary.org

Vous pouvez aussi contacter Mathieu MANGEOT par courriel a l’adresse suivante : mailto:mangeot@nii.ac.jp

Presentation :

Multilingual lexical databases are repositories of structured information built to provide an easy access to all available meanings of words and to allow the creation of a number of computer programs that will process texts using various types of lexical information.

Over the last decade, there has been an accumulation of lexical resources in NLP laboratories and on the Internet. This accumulation poses problems which researchers try to solve by organizing the manipulation and the access to these resources. These databases are a central point of research in the language sciences, and in the development of new human language technologies. Like genomic databases, lexical databases are complex, evolving and richly annotated repositories, and pose interesting challenges for efficient representation, indexing and query.

The goals of the workshop are to take stock of existing research in multilingual lexical databases and to identify the key problems. More broadly, the workshop will help define the research questions of the new Papillon "multilingual lexical database community" and initiate the interchange of relevant ongoing problems and results between this community and other communities (lexicography, translation,

human-computer interactions, database community at large).

Papillon is a project of construction and collaborative usage on the web of a multilingual lexical database and electronic dictionaries derived in open source (French, English, Japanese, Thai, Lao, Vietnamese) Participants will represent a range of domains including databases, linguistics, computational linguistics, annotation and markup.

For more information, please consult the Papillon web server at: http://www.papillon-dictionary.org

You can also contact Mathieu MANGEOT by email at: mailto:mangeot@nii.ac.jp

Programme en bref 小プログラム :


Mardi 16日( 火)

Mercredi 17日( 水 )

Jeudi 18日( 木 )


Exposés : papillon général

Exposés : projets partenaires

Exposés : interactions


Ouverture : Kinji ONO

E7 Jim Breen



E1 Emmanuel PLANAS

E8 Ulrich APEL

E15 Valérie BELLYNCK


Pause café 休憩

Pause café 休憩

Pause café 休憩



E9 Laurent ROMARY

E16 Emmanuel PLANAS


E3 Mathieu MANGEOT

E10 Keita TSUJI

E17 Fatiha SADAT


Déjeuner 昼食

Déjeuner 昼食

Déjeuner 昼食


Exposés : structure des articles

Exposés : traduction et axies



E11 Christian BOITET



E5 Mathieu MANGEOT

E12 Kyoko KURODA

Table ronde construction
lexicale coopérative


E6 Michael ZOCK



Posters P1-P5

Discussion libre

Cérémonie de clôture


Pause café 休憩

Pause café 休憩

Café d’adieu 休憩


Atelier sur les articles

Atelier sur les articles

Réunion interne Papillon



Dîner à l’institut 会食


Programme détaillé プログラムの詳細 :


Mardi 16 juillet 2002 年07月16日(火)
14F, salle 1412 号室
09h45 - 10h00
Accueil はじめに
10h00 - 10h15
Cérémonie d’ouverture 開会 :

Prof. Kinji ONO, Executive Director of Research,
National Institute of Informatics

10h15 - 12h00
Exposés 発表 : présentation générale du projet
Président de séance 議長 chairman : Christian BOITET

10h15 - 10h40

Emmanuel PLANAS :
Papillon project : what do we want to achieve, and how.

10h45 - 11h00
Pause café 休憩

11h00 - 11h25

Current Status of the Papillon Server Development

11h30 - 11h55

Mathieu MANGEOT :
How to Import an Existing XML Dictionary Into the Papillon Plateform

12h00 - 13h45
Pause déjeuner 昼食
13h45 - 15h15
Exposés 発表 : structure des articles et accès
Président de séance 議長 : Gilles SÉRASSET

13h45 - 14h10

Mutsuko TOMOKIYO :
Report on lexical description for monolingual dictionaries in Japanese, French and English in the Papillon lexical data base

14h15 - 14h40

Mathieu MANGEOT :
Proposal for Changes in the Monolingual XML Schema

14h45 - 15h10

Michaël ZOCK :
Electronic dictionaries for men, machines or for both?

15h15 - 16h15
Session spéciale : posters & démos
Président de séance 議長 : Emmanuel PLANAS

Vincent BERMENT : Several Technical Issues for Building New Lexical Bases

Lim BENG TAT : Report on Possible Processes involved and information usage in the Papillon Project for WSD

François LAREAU : A Practical Guide for Writing DiCo Entries

Didier SCHWAB : Hardening of Acception Links Throught Vectorized Lexical Functions

Aree TEERAPARBSEREE : A Practical Guide to Lexical Data Acquisition with RECUPDIC

16h15 - 16h45
Pause café 休憩
16h45 - 18h45
Atelier (workshop) sur la rédaction d’articles


Mercredi 17 juillet 2002 年07月17 日 (水)
14F, Salle 1412 号室
9h45 - 12h00
Exposés 発表 : projets partenaires
Président de séance 議長 : François BROWN DE COLSTOUN

9h45 - 10h10

Practical Issues and Problems in Building a Multi-Lingual Lexicon

10h15 - 10h40

Ulrich APEL :
WaDokuJT : A Japanese-German Dictionary Database

10h45 - 11h00
Pause café 休憩

11h00 - 11h25

Laurent ROMARY :
An abstract model for the representation of multilingual terminological data: TMF – Terminological Markup Framework

11h30 - 11h55

Keita TSUJI :
Extracting French-Japanese Word Pairs from bilingual Corpora Based on Translation Rules (HOTARU project)

12h00 - 13h45
Pause déjeuner 昼食
13h45 - 15h15
Exposés 発表 : liens interlingues et traduction
Président de séance 議長 : Jim BREEN

13h45 - 14h10

Christian BOITET :
The translation of examples, citations, definitions and glosses in the Papillon project

14h15 - 14h40

Kyoko KURODA :
Divergences de Traduction : cas des structures argumentales du japonais et du français

14h45 - 15h10

Automatically Populating Acception Lexical Database through Bilingual Dictionaries and Conceptual Vectors

15h15 - 16h15
Discussion libre ディスカッション
16h15 - 16h45
Pause café 休憩
16h45 - 18h45
Atelier (workshop) sur la rédaction d’articles
Dîner à l’institut franco-japonais
会食 :日仏学院にて

Les intervenants se verront offrir le repas par l’ambassade de France.
発表者 の会食はフランス大使館より提供されます。

Plan d’accès 地図 http://www.ifjtokyo.or.jp/institut/map.html



Jeudi 18 juillet 2002 年07月18 日 (木)
14F, Salle 1412 号室
9h45 - 12h00
Exposés 発表 : interactions avec l’extérieur
Président de séance 議長 chairman : Ulrich APEL

9h45 - 10h10

Multi-Access User Interface for Papillon

10h15 - 10h40

Emmanuel PLANAS :
Papillon project and Industrial Businesses: how they could cooperate

10h45 - 11h00
Pause café 休憩

11h00 - 11h25

Valérie BELLYNCK :
Bases lexicales multilingues et objets pédagogiques interactifs
Multilingual Lexical Databases and Web Based Interactive Language Learning Objects

11h30 - 11h55

Fatiha SADAT :
A Combination of Models for Bilingual Lexicon Extraction from Comparable Corpora

12h00 - 13h45
Pause déjeuner 昼食
13h45 - 14h15

Analyze of the results of a collaborative project for the creation of a Japanese-French dictionary.

14h15 - 16h00
Table ronde :
Construction lexicale coopérative
16h00 - 16h15
Cérémonie de clôture 閉会
16h15 - 16h30
Café d’adieu 休憩
16h30 - 17h15
Réunion interne au projet 内部デイスカッション

structuration du projet (tâches, groupes de travail, comité directeur)

17h15 - 18h15
Réunion interne au projet 内部デイスカッション

programme pour 2002-2003, prochaine réunion, prospective

Liste des auteurs et articles

Ulrich APEL

WaDokuJT - A Japanese-German Dictionary Database. 5 p.


Bases lexicales multilingues et objets pédagogiques interactifs : Sensillon pour Papillon. 13 p.

Multilingual Lexical Databases and Web-based Interactive Language Learning Objects: Sensillon for Papillon.

Lim BENG TAT & Tang ENYA KONG (presented by G. SÉRASSET)

Report on Possible Processes involved and information usage in the Papillon Project for WSD. 3 p.

Vincent BERMENT (presented by Ch. BOITET)

Several Technical Issues for Building New Lexical Bases. 5 p.


Practical Issues and Problems in Building a Multi-Lingual Lexicon. 6 p.

Christian BOITET

The translation of examples, citations, definitions and glosses in the Papillon project. 10 p.


Analyze of the results of a collaborative project for the creation of a Japanese-French dictionary. 10 p.


Divergences de Traduction : cas des structures argumentales du japonais et du français. 17 p.



Automatically Populating Acception Lexical Database through Bilingual Dictionaries and Conceptual Vectors. 16 p.

François LAREAU (Presented by M. MANGEOT)

A Practical Guide for Writing DiCo Entries. 4 p.


How to Import an Existing XML Dictionary Into the Papillon Plateform. 10 p.

Proposal Changes for the Monolingual XML Schema. 7 p.

Emmanuel PLANAS

Papillon project : what do we want to achieve, and how. 5 p.

Papillon project and Industrial Businesses: how they could cooperate.

Laurent ROMARY

An abstract model for the representation of multilingual terminological data: TMF – Terminological Markup Framework. 9 p.

Fatiha SADAT

A Combination of Models for Bilingual Lexicon Extraction from Comparable Corpora. 6 p.


Hardening of Acception Links Throught Vectorized Lexical Functions. 17 p.


Current Status of the Papillon Server Development. 7 p.


A Practical Guide to Lexical Data Acquisition with Recupdic. 17 p.


Multi-Access User Interface for Papillon. 8 p.


Report on lexical description for monolingual dictionaries in Japanese, French and English in the Papillon lexical data base. 13 p.


Extracting French-Japanese Word Pairs from bilingual Corpora Based on Translation Rules. 4 p.

Michael ZOCK

Electronic dictionaries for men, machines or for both? 6 p.

Formulaire d’inscription


Registration Form

Nom name :

Prénom first name :

Courriel メール email :

Choisissez un mot de passe
パスワードを選んで下さい :
Choose a password

Mardi 16 日(火) Tuesday :

Mercredi 17 日(水) Wednesday :

Jeudi 18 日(木) Thursday :

Dîner de mercredi soir 17 日(水)の会食


Si vous ne pouvez vous enregistrer en ligne, retournez l'inscription par courrier ou fax à :


If you can't register online, please return the registration form by regular mail or fax to:

Mathieu Mangeot-Lerebours マンジョ・マチュー

National Institute of Informatics


Hitotsubashi 2-1-2-1913




〒101-8430 TOKYO


Fax: +81-3-3556-1916
